понедельник, 12 января 2015 г.

Аналитика в дистанционном обучении (кейс для работы)

Автор: Эдуард Бабушкин.


В ответ на мою просьбу (см. пост Оценка удовлетворенностью электронным курсом (предложение)) мне прислали файл с данными, а я их вам передаю.
Данные реальные! Я только закодировал названия курсов и должностей, чтобы нельзя было по ним догадаться, что это за компания. Сам я пока ничего не считал.

Итак, кейс

У вас есть файл excel в 36 066 строк со следующими переменными
  1. ID пользователя - уникальный код работника
  2. Дата создания - дата прохождения курса
  3. курс - уникальный код курса
  4. позиция - занимаемая должность
  5. Дата рождения - того, кто проходил курс
  6. Дата приёма - на работу учащегося
  7. Дата увольнения - его же дата увольнения (если пустое поле, значит работает)
  8. Оцени удобство перемещения по курсу - оценка логистики курса учащимся
  9. Сколько времени потратил на изучение курса в минутах? Введи число - оценка учащимся времени прохождения курса
  10. Оцени весь курс по пятибальной оценке - оценка курса учащимся
Вопросы к вам:
  • Какие результаты мы можем извлечь из данного файла;
  • Этот же вопрос в другой формулировке: какие гипотезы можно выдвинуть, исходя из имеющихся данных;
  • Посмотрите на данные и скажите, какие данные вызывают недоверие и почему.
Считать пока ничего не надо, просто выдвигайте гипотезы, если вы не умеете посчитать, посчитаю я. Мне важно, чтобы вы научились зряче смотреть на данные.
ПыСы. осторожней качайте файл
Аналитика в дистанционном обучении (данные для анализа)

4 комментария:

  1. Спасибо за задачку!

    Можно попробовать сделать следующее:
    1. Найти курсы, оценки которых сильно отличаются от оценок других курсов, таким образом выделить курсы, которые стоит доработать (низкие оценки) и те, на которые стоит ориентироваться (высокие оценки).
    2. Должность или уровень должности связаны с оценками курсов. Если это так, то стоит учитывать это при разработке в будущем.
    3. Срок жизни сотрудника в компании связан с оценками удобства и оценками курсов в целом (или каких-то определенных курсов, например адаптационных).
    4. Оценка удобства курсов связана с возрастом сотрудников.

    Данные, которые вызывают сомнения:
    1. Оценка времени в минутах. Во-первых из-за субъективности оценок, во-вторых из-за возможных ошибок ввода.
    2. Жаль, что нет данных об оценках прохождения курсов, можно было бы сравнить их с возрастом жизни сотрудников в компании, должностью сотрудников.

    ОтветитьУдалить
    Ответы
    1. "Жаль, что нет данных об оценках прохождения курсов, можно было бы сравнить их с возрастом жизни сотрудников в компании, должностью сотрудников."

      спасибо за коммент!
      мне данные дали, и я сделал новый пост - смотрите дальше)

      Удалить
  2. Эдуард, на основании этих данных сложновато строить гипотезы..

    - удивительно, что такой разброс по потраченному на обучение времени - от 15 до 280 мин.
    И потому странно, что оценки за удобство и весь курс - в целом 5..
    При таком разбросе и оценки - по идее, должны плавать от 2 до 5..

    Вообще, единственное, что мне удалось извлечь из этого файла - это то, что учащихся на курсе можно разделить на группы - по потраченному времени и уже потом анализировать, почему они потратили именно столько времени на курс..

    ОтветитьУдалить