Почему для того, чтобы работать с Big Data, надо быть немного сумасшедшим
Пришли коллеги из Big Data и сказали, что надо про них рассказать. Рассказываю! Интересно кто-нибудь из моих читателей, что-то поймет? :-)

Данные, которые не поддаются логическому анализу человеком
Big Data стала модной. Это слово используют по поводу и без. У нас — одна из самых больших выборок данных, имеющая огромный коммерческий потенциал для применений внутри ВымпелКома. Вопрос в том, что конкретно с этим морем событий делать.
Когда несколько лет назад мы только стартовали направление больших данных в Билайн, проблемы были чёткие и понятные. Нужна была вычислительная мощность и СХД — у нас через некоторое время появился современный кластер «молотилок». Нужны были обучающие выборки — напряглись и создали, где-то — силами сотрудников со всей страны. Нужны были люди — и на интересную задачу пришли наши профессионалы, имеющие десятки научных публикаций за рубежом по Data Mining и машинному обучению. Нужно было проверить выводы на практике «в поле» — ездили. Всё решается.
Наше новое «бутылочное горлышко» — вопрос того, как найти больше людей, которые хорошо умеют делать реальные аналитические продукты. И мы знаем, что в эту проблему упёрлись почти все те, кто занимается Data Mining в стране. Банки, страховые, другие операторы, химики, геологоразведка, автоконцерны, R&D и так далее.
( Collapse )

Данные, которые не поддаются логическому анализу человеком
Big Data стала модной. Это слово используют по поводу и без. У нас — одна из самых больших выборок данных, имеющая огромный коммерческий потенциал для применений внутри ВымпелКома. Вопрос в том, что конкретно с этим морем событий делать.
Когда несколько лет назад мы только стартовали направление больших данных в Билайн, проблемы были чёткие и понятные. Нужна была вычислительная мощность и СХД — у нас через некоторое время появился современный кластер «молотилок». Нужны были обучающие выборки — напряглись и создали, где-то — силами сотрудников со всей страны. Нужны были люди — и на интересную задачу пришли наши профессионалы, имеющие десятки научных публикаций за рубежом по Data Mining и машинному обучению. Нужно было проверить выводы на практике «в поле» — ездили. Всё решается.
Наше новое «бутылочное горлышко» — вопрос того, как найти больше людей, которые хорошо умеют делать реальные аналитические продукты. И мы знаем, что в эту проблему упёрлись почти все те, кто занимается Data Mining в стране. Банки, страховые, другие операторы, химики, геологоразведка, автоконцерны, R&D и так далее.
( Collapse )