Skip to content

ElenaSaveleva/Project_1_

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Проект 1. Анализ резюме из HeadHunter

(ссылка на проект https://colab.research.google.com/drive/1xwfnXUaP8w2dc-riTp5c_DDAJN0eKe_w?usp=sharing)

(ссылка на датасет https://drive.google.com/file/d/17ymUc_BW7Op-Xy1wfycFswszwE2-OQ0z/view?usp=sharing)

Оглавление

  1. Описание проекта
  2. Основная проблема проекта?
  3. Краткая информация о данных
  4. Этапы работы над проектом
  5. Результат
  6. Выводы

Описание проекта

На основе датасета резюме с сайта поиска вакансий hh.ru, необходимо подготовить первичные данные для построения модели, которая бы автоматически определяла примерный уровень заработной платы, подходящей пользователю, исходя из информации, которую он указал о себе.

⬆️к оглавлению

Основная проблема проекта?

Необходимо подготовить имеющиеся данные путем их преобразования с возможностью дальнейшего исследования и проведения очистки, это позволит в дальнейшем построить модель, которая бы автоматически определяла примерный уровень заработной платы, подходящей пользователю, исходя из информации, которую он указал о себе в соем резюме.

Условия выполнения проекта:

  • Осуществить базовый анализ структуры данных
  • Выполнить преобразование данных
  • Сделать разведывательный анализ
  • Произвести очистка данных

Оценка результатов: Результаты оцениваются согласно требованиям, указанным к проекту. Необходимо: ответить на контрольные вопросы (максимум 30 баллов), сдать проект на проверку, загрузив ноутбук-шаблон со своим решением на GitHub (максимум 10 баллов)

Чему учимся: Учимся корректно писать код на Python для анализа и преобразовывать исходные данные, практикуем методы очистки данных, навыки по представлению проекта на GitHub

⬆️к оглавлению

Краткая информация о данных

В данном проекте первоначальные данные представлены в виде датасета размером: 44744 строки, 12 столбцов, типа object, в отдельных столбцах присутствуют пропуски и дубликаты. В связи с этим необходимо более детально проанализировать первоначальные данные, сделать выводы о дальнейших преобразованиях.

данные используемые в проекте:

  • dst-3.0_16_1_hh_database.csv - база резюме, выгруженная с сайта поиска вакансий hh.ru
  • ExchangeRates.csv - курсы валют

⬆️к оглавлению

Этапы работы над проектом

  • Ознакомление с описанием задачи
  • Базовый анализ исходных данных
  • Преобразование данных
  • Разведывательный анализ
  • Очистка данных
  • Проверка соответствия написанного кода стандарту PEP8
  • Оформление проекта
  • Загрузка проекта на GitHub

⬆️к оглавлению

Результат

Проект c "Анализ резюме из HeadHunter " представлен в репозитории на GitHub

⬆️к оглавлению

Выводы

В процессе выполнения проекта первоначальные данные были проанализированы, преобразованы, проведен разведывательный анализ данных с последующей визуализацией результатов с целью выявления взаимосвязей между признаками, данные были очищены от пропусков и дубликатов. Таким образом первоначальный датасет подготовлен для дальнейшего использования при построении требуемой модели.

⬆️к оглавлению

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published