Лабораторна робота по Системи data science
250 UAH1.1Розуміння бізнесу —розуміння даних:–визначення предметної області для дослідження і попередня постановка задачі моделюванняв рамках конкретного контексту з обраної предметної області; (типові задачі моделювання)–збір/вибір сирих даних з будь-яких відкритих ресурсів (використання відповідних APIs, завантаження наборів даних вручну);–збереженняресурсів даних які потрібні для вирішення конкретної задачі, в певному форматі (наприклад, у випадку APIs):табличні дані CSV, або інший формат з роздільниками, файли електронних таблиць Excel (.xls, .xslsx), OpenDocument (.ods), тощо (бібліотека pandasнадає широкий функціонал керування даними в табличному вигляді —dataframe);–візуалізація (елементарний опис зібраного набору даних: характеристики записів (features), кількість записів і т.д., наприклад,
9pandasфункція info) ідокументування результатів/документування класів бізнес-профіля Еріксона-Пенкера.
1.2Підготовка даних:–первинна очистка даних (pandas):oприведення даних до стандартних форматів (числові, текстові формати, усунення objects);oвидалення записів-дублікатів;oусунення NaN, Nullзначень (наприклад, заміна на середні значення відповідних характеристик або видалення записів з NaN, Nullзначеннями);–розвідувальний аналіз даних —EDA, Exploratory Data Analysis(matplotlib, seaborn):oзастосування описової статистики —розрахунок середніх арифметичних, дисперсій, мод, медіан усіх характеристик (наприклад, pandasфункція describe);oпроведення кореляційного та причинно-наслідкового аналізів (наприклад, див. pandasфункцію corr, seabornфункції heatmap, pairplot, jointplot);oтощо;–конструювання ознак (feature engineering) на основі проведеного EDA (за необхідності):oвидалення зайвих характеристик;oпоєднання/композиція (наприклад, визначення нової характеристики як добуток існуючих характеристик та , тобто ) характеристик у нові, нелінійні;oкодування категоріальних (categorical) характеристик (наприклад, one-hot encoding, pandasфункція get_dummies, звернути увагу на тип даних categorical);–розбиття набору даних на тренувальний, валідаційний (за необхідності) та тестовий набори даних (наприклад, scikit-learnфункція train_test_split);–візуалізація і документування результатів/документування класів бізнес-профіля Еріксона-Пенкера.
1.3Верифікація і валідація.
1.4Висновки
Додатки 1
Актуальні фриланс-проєкти в категорії Машинне навчання
Зробити роботу на матлабіНеобхідно виконати завдання в середовищі матлабу, ціну можна обговорити. Буду вельми вдячний за допомогу оскільки сам не справляюся Машинне навчання, Парсинг даних ∙ 2 ставки |
Потрібно зробити автоматизацію на make com (GPT + TG + Notion)Усім привіт, потрібно зробити деяку автоматизацію: 1. відправляти у telegram файл у форматі json з завданням (файл буде з однаковими ключами в json) 2. Обробляти json у make com 3. Створювати відповідне завдання у відповідному teamspace у Notion У кого є досвід та бажання?… Машинне навчання, Обробка даних ∙ 1 ставка |
Прогноз графік Forex
2000 UAH
Тз 1. Взяти графік довжиною в рік (графік є) 2. Розділити цей графік на тренувальну вибірку та тестову 3. Навчити нейромережу передбачати графік за допомогою трансформерів 4. Зробити перевірку на тестовій вибірці Або якщо у вас є рішення, готовий купити Потрібно… Машинне навчання |
Ai - openvoice - TTS - створення облачного сервісу1 . Обговорення можливостей реалізації роботи з клонування голосу в хмарній інфраструктурі 2 . Обговорення можливостей професійного імітації завантажених голосів, text to speech - speech to speech 3 . Можливість багатоточної роботи в режимі реального часу, з мінімальною можливою… Python, Машинне навчання ∙ 3 ставки |
Інтеграція чат-ботаПотрібно підключити готовий чат-бот, створений на chatbase.co (в системі є інтеграція з wa). Але я не встиг підключитися через FB. IP-телефонія та VoIP, Машинне навчання ∙ 3 ставки |