Как големите данни помагат в борбата с пандемията

Как анализът на големи данни може да помогне да победим коронавируса и как технологиите за машинно обучение могат да ни позволят да анализираме огромно количество данни? Отговор на тези въпроси търси Николай Дубинин, водещ на Youtube канала Industry 4.0.

Анализът на големи данни е един от най-мощните начини за проследяване на разпространението на вируса и победа над пандемията. Преди 160 години се случи една история, която ясно показа колко е важно да се събират данни и бързо да се анализират.

Карта на разпространението на коронавирус в Москва и Московска област.

Как започна всичко? 1854 г. Лондонският район Сохо е засегнат от епидемия от холера. За десет дни умират 500 души. Никой не разбира източника на разпространение на болестта. По това време се е смятало, че болестта се предава от вдишването на нездравословен въздух. Всичко промени доктор Джон Сноу, който стана един от основателите на съвременната епидемиология. Той започва да интервюира местните жители и поставя всички идентифицирани случаи на болестта на картата. Статистиката показва, че повечето от загиналите са близо до тръбата на Broad Street. Не въздухът, а водата, отровена от канализацията, предизвика епидемията.

Услугата на Tectonix показва, използвайки примера на плаж в Маями, как тълпите могат да повлияят на разпространението на епидемии. Картата съдържа милиони парчета анонимни данни с геолокация, идващи от смартфони и таблети.

Сега си представете колко бързо се разпространява коронавирусът у нас след задръстване в московското метро на 15 април. Тогава полицията проверяваше дигиталния пропуск на всеки човек, слязъл в метрото.

Защо се нуждаем от цифрови пропуски, ако системата не може да се справи с тяхната проверка? Има и камери за наблюдение.

Според Григорий Бакунов, директор по разпространение на технологии в Yandex, системата за разпознаване на лица, която работи днес, разпознава 20-30 fps на един компютър. Струва около $10. В същото време в Москва има 200 камери. За да работи всичко в реален режим, трябва да инсталирате около 20 хиляди компютъра. Градът няма такива пари.

В същото време на 15 март в Южна Корея се проведоха офлайн парламентарни избори. Избирателната активност за последните шестнадесет години е рекордна – 66%. Защо не се страхуват от многолюдни места?

Южна Корея успя да обърне развитието на епидемията в страната. Те вече имаха подобен опит: през 2015 и 2018 г., когато имаше огнища на вируса MERS в страната. През 2018 г. те взеха предвид грешките си от преди три години. Този път властите действаха особено решително и свързаха големи данни.

Движенията на пациента се наблюдават с помощта на:

  • записи от камери за наблюдение

  • транзакции с кредитни карти

  • GPS данни от автомобили на граждани

  • Мобилни телефони

Тези, които бяха под карантина, трябваше да инсталират специално приложение, което алармира властите за нарушители. Беше възможно да се видят всички движения с точност до минута, а също и да се установи дали хората носят маски.

Глобата за нарушение беше до 2,5 хиляди долара. Същото приложение уведомява потребителя, ако наблизо има заразени хора или тълпа от хора. Всичко това е паралелно с масовото тестване. Всеки ден в страната са правени до 20 теста. Създадени са 633 центъра само за тестове за коронавирус. Имаше и 50 станции на паркинги, където можете да направите теста, без да излизате от колата си.

Но както правилно отбелязва научният журналист и създател на научния портал N + 1 Андрей Коняев, Пандемията ще отмине, но личните данни ще останат. Държавата и корпорациите ще могат да проследяват поведението на потребителите.

Между другото, според последните данни, коронавирусът се оказа по-заразен, отколкото предполагахме. Това е официално изследване на китайски учени. Стана известно, че COVID-19 може да се предаде от един човек на пет или шест души, а не двама или трима, както се смяташе досега.

Коефициентът на заразяване с грип е 1.3. Това означава, че един болен човек заразява един или двама души. Първоначалният коефициент на заразяване с коронавирус е 5.7. Смъртността от грип е 0.1%, от коронавирус – 1-3%.

Данните са представени към началото на април. Много случаи остават недиагностицирани, защото лицето не е тествано за коронавирус или заболяването протича безсимптомно. Затова в момента е невъзможно да се направят изводи за числата.

Технологиите за машинно обучение са най-добрите при анализирането на огромно количество данни и помагат не само за проследяване на движения, контакти, но също така:

  • диагностицира коронавирус

  • търси лекарство

  • търси ваксина

Много компании обявяват готови решения, базирани на изкуствен интелект, които автоматично ще откриват коронавирус не чрез анализ, а например чрез рентгеново или компютърно сканиране на белите дробове. Така лекарят веднага започва да работи с най-тежките случаи.

Но не всеки изкуствен интелект има достатъчен интелект. В края на март медиите разпространиха новината, че нов алгоритъм с точност до 97% може да определи коронавируса чрез рентгенова снимка на белите дробове. Оказа се обаче, че невронната мрежа е обучена само върху 50 снимки. Това са около 79 снимки по-малко, отколкото са ви необходими, за да започнете да разпознавате болестта.

DeepMind, подразделение на компанията майка на Google Alphabet, иска напълно да пресъздаде протеиновата структура на вирус, използвайки AI. В началото на март DeepMind каза, че неговите учени са стигнали до разбиране за структурата на протеините, свързани с COVID-19. Това ще помогне да се разбере как функционира вирусът и ще ускори търсенето на лекарство.

Какво още да прочетете по темата:

  • Как технологиите предсказват пандемии
  • Друга коронавирусна карта в Москва
  • Как ни проследяват невронните мрежи?
  • Светът след коронавируса: Ще се изправим ли пред епидемия от тревожност и депресия?

Абонирайте се и ни следвайте в Yandex.Zen — технологии, иновации, икономика, образование и споделяне в един канал.

Оставете коментар