Приемане на подобни данни: как бизнесът се научава да печели от големи данни

Чрез анализиране на големи данни компаниите се научават да разкриват скрити модели, подобрявайки бизнес ефективността си. Посоката е модерна, но не всеки може да се възползва от големите данни поради липсата на култура за работа с тях

„Колкото по-разпространено е името на човек, толкова по-вероятно е той да плати навреме. Колкото повече етажи има къщата ви, толкова по-статистически сте по-добър кредитополучател. Знакът на зодиака няма почти никакъв ефект върху вероятността за възстановяване на сумата, но психотипът го прави значително ”, казва Станислав Дужински, анализатор в Home Credit Bank, за неочаквани модели в поведението на кредитополучателите. Той не се наема да обясни много от тези закономерности – разкрити са от изкуствен интелект, обработил хиляди клиентски профили.

Това е силата на анализа на големи данни: като анализира огромно количество неструктурирани данни, програмата може да открие много корелации, за които и най-мъдрият човешки анализатор дори не подозира. Всяка компания разполага с огромно количество неструктурирани данни (big data) – за служители, клиенти, партньори, конкуренти, които могат да се използват в полза на бизнеса: подобряване на ефекта от промоциите, постигане на ръст на продажбите, намаляване на текучеството на персонала и др.

Първите, които започнаха да работят с големи данни, бяха големите технологични и телекомуникационни компании, финансовите институции и търговията на дребно, коментира Рафаил Мифтахов, директор на Deloitte Technology Integration Group, CIS. Сега има интерес към подобни решения в много индустрии. Какво са постигнали компаниите? И винаги ли анализът на големи данни води до ценни заключения?

Не е лесно натоварване

Банките използват алгоритми за големи данни предимно за подобряване на клиентското изживяване и оптимизиране на разходите, както и за управление на риска и борба с измамите. „През последните години се случи истинска революция в областта на анализа на големи данни“, казва Дужински. „Използването на машинно обучение ни позволява да прогнозираме много по-точно вероятността от неизпълнение на кредита – просрочието в нашата банка е само 3,9%.“ За сравнение, към 1 януари 2019 г. делът на кредитите с просрочени плащания над 90 дни по кредитите, отпуснати на физически лица, според Централната банка е 5%.

Дори организациите за микрофинансиране са озадачени от изучаването на големи данни. „Предоставянето на финансови услуги без анализиране на големи данни днес е като правене на математика без числа“, казва Андрей Пономарев, главен изпълнителен директор на Webbankir, онлайн платформа за кредитиране. „Ние издаваме пари онлайн, без да виждаме нито клиента, нито неговия паспорт, и за разлика от традиционното кредитиране, трябва не само да оценим платежоспособността на дадено лице, но и да идентифицираме неговата личност.“

Сега базата данни на компанията съхранява информация за повече от 500 хиляди клиенти. Всяко ново приложение се анализира с тези данни в около 800 параметъра. Програмата взема предвид не само пол, възраст, семейно положение и кредитна история, но и устройството, от което човек е влязъл в платформата, как се е държал в сайта. Например, може да е тревожно, че потенциален кредитополучател не е използвал кредитен калкулатор или не е попитал за условията на заема. „С изключение на няколко спирачни фактора - да речем, ние не издаваме заеми на лица под 19 години - нито един от тези параметри сам по себе си не е причина за отказ или съгласие за издаване на заем“, обяснява Пономарев. Важна е комбинацията от фактори. В 95% от случаите решението се взема автоматично, без участието на специалисти от поемащия отдел.

Предоставянето на финансови услуги без анализиране на големи данни днес е като правене на математика без числа.

Анализът на големи данни ни позволява да извлечем интересни модели, споделя Пономарев. Например потребителите на iPhone се оказаха по-дисциплинирани кредитополучатели от собствениците на устройства с Android - първите получават одобрение на приложения 1,7 пъти по-често. „Фактът, че военните не изплащат заеми почти една четвърт по-рядко от средния кредитополучател, не беше изненада“, казва Пономарев. „Но обикновено от студентите не се очаква да бъдат задължени, но междувременно случаите на просрочени кредити са с 10% по-рядко срещани от средното за базата.“

Изследването на големи данни позволява точкуване и за застрахователите. Създадена през 2016 г., IDX се занимава с дистанционна идентификация и онлайн проверка на документи. Тези услуги са търсени сред застрахователите на товари, които се интересуват от загубата на стоки възможно най-малко. Преди да застрахова превоза на товари, застрахователят със съгласието на шофьора проверява надеждността, обяснява Ян Слока, търговски директор на IDX. Заедно с партньор - петербургската компания "Risk Control" - IDX разработи услуга, която ви позволява да проверите самоличността на водача, паспортни данни и права, участие в инциденти, свързани със загуба на товар и др. След анализ базата данни на шофьорите, компанията идентифицира „рискова група“: най-често товарът се губи сред шофьори на възраст 30–40 години с дълъг шофьорски опит, които наскоро често са сменяли работата си. Оказа се още, че товарът най-често се краде от водачи на автомобили, чийто експлоатационен живот надхвърля осем години.

В търсене на

Търговците на дребно имат различна задача – да идентифицират клиентите, които са готови да направят покупка, и да определят най-ефективните начини да ги доведат до сайта или магазина. За целта програмите анализират профила на клиентите, данните от личния им акаунт, историята на покупките, заявките за търсене и използването на бонус точки, съдържанието на електронни кошници, които са започнали да попълват и са изоставили. Анализът на данни ви позволява да сегментирате цялата база данни и да идентифицирате групи от потенциални купувачи, които може да се интересуват от конкретна оферта, казва Кирил Иванов, директор на офиса за данни на групата M.Video-Eldorado.

Например, програмата идентифицира групи клиенти, всяка от които харесва различни маркетингови инструменти – безлихвен заем, връщане на пари или промо код за отстъпка. Тези купувачи получават имейл бюлетин със съответната промоция. Вероятността човек, отворил писмото, да отиде на сайта на компанията, в този случай се увеличава значително, отбелязва Иванов.

Анализът на данните също ви позволява да увеличите продажбите на свързани продукти и аксесоари. Системата, обработила хронологията на поръчките на други клиенти, дава на купувача препоръки какво да закупи заедно с избрания продукт. Тестването на този метод на работа, според Иванов, показва увеличение на броя на поръчките с аксесоари с 12% и увеличение на оборота на аксесоари с 15%.

Търговците не са единствените, които се стремят да подобрят качеството на обслужване и да увеличат продажбите. Миналото лято MegaFon пусна услуга за „интелигентни“ предложения, базирана на обработката на данни от милиони абонати. Изследвайки поведението им, изкуственият интелект се научи да формира персонални оферти за всеки клиент в рамките на тарифите. Например, ако програмата забележи, че човек активно гледа видео на устройството си, услугата ще му предложи да увеличи обема на мобилния трафик. Като взема предвид предпочитанията на потребителите, компанията предоставя на абонатите неограничен трафик за любимите им видове интернет свободно време - например използване на месинджъри или слушане на музика в стрийминг услуги, чат в социални мрежи или гледане на телевизионни предавания.

„Ние анализираме поведението на абонатите и разбираме как се променят техните интереси“, обяснява Виталий Щербаков, директор за анализ на големи данни в MegaFon. „Например тази година трафикът на AliExpress е нараснал 1,5 пъти в сравнение с миналата година и като цяло броят на посещенията в онлайн магазините за дрехи расте: 1,2–2 пъти в зависимост от конкретния ресурс.“

Друг пример за работа на оператор с големи данни е платформата MegaFon Poisk за търсене на изчезнали деца и възрастни. Системата анализира кои хора биха могли да се намират в близост до мястото на изчезналия и им изпраща информация със снимка и признаци на изчезналия. Операторът разработи и тества системата съвместно с Министерството на вътрешните работи и организацията Lisa Alert: в рамките на две минути ориентация към изчезналото лице получават повече от 2 хиляди абонати, което значително увеличава шансовете за успешен резултат от търсенето.

Не ходете в Кръчмата

Анализът на големи данни също намери приложение в индустрията. Тук ви позволява да прогнозирате търсенето и да планирате продажбите. И така, в групата компании Cherkizovo преди три години беше внедрено решение, базирано на SAP BW, което ви позволява да съхранявате и обработвате цялата информация за продажбите: цени, асортимент, обеми на продукти, промоции, канали за дистрибуция, казва Владислав Беляев, CIO от групата ” Черкизово. Анализът на натрупаните 2 TB информация не само позволи ефективно формиране на асортимента и оптимизиране на продуктовото портфолио, но и улесни работата на служителите. Например, изготвянето на дневен отчет за продажбите ще изисква един ден работа на много анализатори – по двама за всеки продуктов сегмент. Сега този отчет се изготвя от робота, като отделя само 30 минути за всички сегменти.

„В индустрията големите данни работят ефективно във връзка с интернет на нещата“, казва Станислав Мешков, главен изпълнителен директор на Umbrella IT. „Въз основа на анализа на данните от сензорите, с които е оборудвано оборудването, е възможно да се идентифицират отклонения в работата му и да се предотвратят повреди и да се предвиди ефективността.“

В Severstal с помощта на големи данни се опитват да решават и доста нетривиални задачи – например да намалят процента на нараняванията. През 2019 г. компанията отдели около 1,1 милиарда рубли за мерки за подобряване на безопасността на труда. Severstal очаква да намали процента на нараняванията с 2025% с 50 (в сравнение с 2017 г.). „Ако пряк ръководител — бригадир, началник на обекта, началник на магазин — забележи, че служител извършва определени операции небезопасно (не се държи за перилата, когато се изкачва по стълбите в промишления обект или не носи всички лични предпазни средства), той изписва специална бележка към него – PAB (от „одит на поведенческата сигурност“)“, казва Борис Воскресенски, ръководител на отдела за анализ на данни на компанията.

След анализ на данни за броя на ПАБ в едно от поделенията, специалистите на компанията установиха, че правилата за безопасност са нарушавани най-често от тези, които вече са имали няколко забележки преди това, както и от тези, които са били в отпуск по болест или в отпуск малко преди това Инцидентът. Нарушенията през първата седмица след завръщане от отпуск или отпуск по болест са два пъти по-високи, отколкото през следващия период: 1 срещу 0,55%. Но работата на нощна смяна, както се оказа, не влияе на статистиката на PAB.

Без връзка с реалността

Създаването на алгоритми за обработка на големи данни не е най-трудната част от работата, казват представители на компанията. Много по-трудно е да се разбере как тези технологии могат да бъдат приложени в контекста на всеки конкретен бизнес. Тук е ахилесовата пета на анализаторите на компаниите и дори външните доставчици, които, изглежда, са натрупали опит в областта на големите данни.

„Често срещах анализатори на големи данни, които бяха отлични математици, но нямаха необходимото разбиране за бизнес процесите“, казва Сергей Котик, директор по развитието в GoodsForecast. Той си спомня как преди две години компанията му е имала възможност да участва в състезание за прогнозиране на търсенето за федерална търговска верига. Беше избран пилотен регион, за всички стоки и магазини, за който участниците направиха прогнози. След това прогнозите бяха сравнени с реалните продажби. Първото място беше заето от един от руските интернет гиганти, известен с експертизата си в машинното обучение и анализ на данни: в своите прогнози той показа минимално отклонение от реалните продажби.

Но когато мрежата започна да изучава по-подробно неговите прогнози, се оказа, че от бизнес гледна точка те са абсолютно неприемливи. Компанията въведе модел, който произвежда планове за продажби със систематично подценяване. Програмата разбра как да сведе до минимум вероятността от грешки в прогнозите: по-безопасно е да се подценяват продажбите, тъй като максималната грешка може да бъде 100% (няма отрицателни продажби), но в посока на прекомерно прогнозиране, тя може да бъде произволно голяма, Котик обяснява. С други думи, компанията представи идеален математически модел, който в реални условия би довел до полупразни магазини и огромни загуби от недопродажби. В резултат на това друга компания спечели конкурса, чиито изчисления могат да бъдат приложени на практика.

„Може би“ вместо големи данни

Технологиите за големи данни са актуални за много индустрии, но активното им внедряване не се среща навсякъде, отбелязва Мешков. Например в здравеопазването има проблем със съхранението на данни: натрупана е много информация и тя редовно се актуализира, но в по-голямата си част тези данни все още не са дигитализирани. В държавните агенции също има много данни, но те не са обединени в общ клъстер. Разработването на единна информационна платформа на Националната система за управление на данни (НСУД) е насочена към решаването на този проблем, казва експертът.

Страната ни обаче далеч не е единствената страна, в която в повечето организации важните решения се вземат на базата на интуиция, а не на анализ на големи данни. През април миналата година Deloitte проведе проучване сред повече от хиляда ръководители на големи американски компании (с персонал от 500 или повече) и установи, че 63% от анкетираните са запознати с технологиите за големи данни, но не разполагат с всички необходими инфраструктура за тяхното използване. Междувременно сред 37% от компаниите с високо ниво на аналитична зрялост почти половината са надхвърлили значително бизнес целите си през последните 12 месеца.

Проучването разкри, че освен трудността при внедряването на нови технически решения, важен проблем в компаниите е липсата на култура за работа с данни. Не трябва да очаквате добри резултати, ако отговорността за решенията, взети на базата на големи данни, се възлага само на анализаторите на компанията, а не на цялата компания като цяло. „Сега компаниите търсят интересни случаи на използване на големи данни“, казва Мифтахов. „В същото време изпълнението на някои сценарии изисква инвестиции в системи за събиране, обработка и контрол на качеството на допълнителни данни, които не са били анализирани преди.“ Уви, „аналитиката все още не е отборен спорт“, признават авторите на изследването.

Оставете коментар