Великі дані на підприємстві

1

Пропоную вашій увазі вибірковий переклад Інтернет-публікації Жан-П'єра Дейкса (Jean-Pierre Dijcks) з Oracle, яка присвячена актуальній на сьогодні проблематиці великих даних. З цієї праці перекладено все, що має відношення безпосередньо до технології і не містить в собі пропаганди зазначеної вельми шановної корпорації. Чи маю я право так робити? Це питання ...

Для тих, хто бажає ознайомитися з оригіналом, його можна знайти тут.


Анотація

На сьогодні термін великі дані привертає багато уваги, але за легендою криється проста історія. Десятиріччями компанії рухали свій бізнес на основі транзакційних даних, які зберігалися в реляційних базах даних. Одначе, окрім цих критично-важливих даних існує потенційний скарб менш структурованих даних, які за звичай ніхто не використовує: у блогах, соціальних мережах, електронній пошті, в даних, отриманих від датчиків, в фотографіях також можна знайти корисну інформацію. Зменшення ціни запам'ятовувальних пристроїв та обчислювальної потужності зробило можливим збирати ці дані, в той час, як лише декілька років тому вони були б просто відкинуті. У результаті все більше компаній намагаються на додаток до даних, що традиційно використовуються на підприємствах, включити у свою бізнес-аналітику нетрадиційні, але потенційно дуже цінні дані.

Для отримання від них справжньої користі для бізнесу потрібні відповідні інструменти для збирання і упорядкування великого розмаїття типів даних, що поступають з різних джерел, та їх ефективного аналізу в контексті всіх даних вашого підприємства. [...]

Визначення великих даних

Під великими даними за звичай розуміють такі типи даних:

  • Транзакційні дані підприємства -- включають інформацію про клієнтів з систем CRM, транзакційні дані з систем ERP, транзакції інтернет-магазинів, дані з бухгалтерського документообігу.
  • Дані, продуковані автоматично, або отримані від датчиків -- включають дані про сесії зв'язку (Call Detail Records -- CDR), блоги, дані від інтелектуальних вимірювачів, виробничих датчиків, хронологічні журнали обладнання (лог-файли, які часто називають цифровими вихлопними системами), дані від торговельних систем.
  • Соціальні дані -- включають потік зворотнього зв'язку від клієнтів, сайти мікроблогів на зразок Twitter, соціальні мережі на зразок Facebook.

Всесвітній Інститут Мак-Кінсі (McKinsey Global Institute) оцінює зростання цих даних в обсязі 40% щороку і цей темп зберігатиметься в період з 2009 по 2020 рік. Але, в той час, як цей параметр є найбільш очевидним, обсяг даних не є єдиною характеристикою, що має значення. Фактично, великі дані визначаються чотирма ключовими характеристиками:

  • Обсяг. Машинні дані продукуються в значно більшому обсязі ніж традиційні дані (В оригіналі -- "нетрадиційні дані" (non-traditional data). Опечатка? Прим. моя -- Chd). Наприклад, один двигун реактивного літака може згенерувати 10Тбайт за 30 хвилин. При загальній кількості полетів 25000 щоденно обсяг даних лише з цього джерела сягне петабайтів за день. Інтелектуальні вимірювачі та крупне промислове устаткування, такі як нафта-переробні станції та бурові установки, продукують дані в подібному темпі, що ще далі ускладнює проблему.
  • Темп. Потоки соціальних даних -- хоч і не настільки масивні, як машинні дані, -- продукують інформацію про думки та взаємні стосунки, які мають цінність в управлінні відносинами з клієнтами. Навіть, якщо кожен з твітів містить в середньому 140 символів, високий темп (або частота подачі) даних в Twitter забезпечує їх великий обсяг (більш ніж 8Тбайт на день).
  • Розмаїття. Формати традиційних даних, як правило, досить чітко визначені і змінюються повільно. На відміну від них, формати нетрадиційних даних демонструють запаморочливі швидкості зміни. З доданням нових служб, розміщенням нових датчиків або проведенням нових маркетингових кампаній для збирання кінцевої інформації з'являється потреба у нових типах даних.
  • Цінність. Економічна цінність різних даних суттєво різниться. Як правило, цінна інформація міститься у значно більшому за обсягом масиві нетрадиційних даних; задача полягає у тому, щоб визначити що саме має цінність, після чого трансформувати та відокремити ці дані для аналізу.

Для отримання найбільшого зиску від великих даних підприємства повинні адаптувати свої ІТ інфраструктури для обробки надвеликих обсягів даних, що надходять у високому темпі, мають різноманітні типи та які можуть бути піддані аналізу сумісно з іншими даними підприємства.

Важливість великих даних

У результаті обробки великих даних та їх аналізу сумісно з традиційними корпоративними даними підприємства здатні отримати більш ретельне і глибоке розуміння аспектів свого бізнесу, що призведе до покращення продуктивності, посилення позиції у конкуренції та більших інновацій -- всього того, що значною мірою визначає кінцевий результат.

Наприклад, в медицині лікування хронічних або довготривалих недуг обходиться дорого. Застосування моніторингових пристроїв, які вимірюють показники життєдіяльності та контролюють зміну стану, є лише одним зі шляхів, яким дані від датчиків можуть бути використані для покращення здоров'я пацієнта та зменшення кількості відвідування медичного закладу або перебування у лікарні.

Компанії-виробники вбудовують датчики в свої продукти для формування потоку телеметричних даних. Інколи це може бути використане для надання послуг на зразок OnStar, що надає можливість спілкування, захисту та навігації. Напевно, ще більш важливим є те, що ці телеметричні дані можуть бути використані для визначення особливостей використання, частоти відмов та можливостей для покращення виробу, зокрема зменшення витрат на розробку та виготовлення.

Поширення смартфонів та інших пристроїв з функцією GPS надає рекламним компаніям можливість звертатися до споживачів у той час, як вони знаходяться поблизу магазину, кафе або ресторану. Це одночасно відкриває додаткові джерела доходів для сервіс-провайдерів та забезпечує багатьом бізнесовим організаціям можливість залучити нових клієнтів.

Роздрібні торговці за звичай знають, хто купує їх продукцію. Використання соціальних мереж та звітів про користування їх сайтами електронної комерції може допомогти їм зрозуміти, хто і чому відмовився від купівлі, тобто отримати ту інформацію, якої сьогодні в них нема. Це може сприяти більш ефективному розподілу загальної аудиторії клієнтів на сегменти з метою проведення краще зорієнтованих маркетингових кампаній, так само, як і підвищити ефективність ланцюжка поставок.

Кінець кінцем, такі соціальні мережі як Facebook та LinkedIn просто не змогли б існувати без великих даних. Їх бізнес модель вимагає персоналізованої взаємодії веб-застосування та користувача, що можливе лише шляхом збирання та використання всіх можливих даних про відвідувача або володаря зареєстрованого облікового запису.


1

Copyright © 2012 Dnipro Networks
Всі права захищені. Використання повністю або частково оригінальних матеріалів з цієї сторінки має супроводжуватися посиланням на сайт Dnipro Networks.