Наука за данните …

Наука за данните и модерни информационни технологии

17.05.2017 | проф. д.м.н. Иван Иванов

 

Data Science – модерно научно направление за анализ на (не) структурирани данни. В днешно време на различни места се събират по различни по състав и структура и много (като обем) данни. Тези данни ги наричаме big data (големи данни). Предизвикателството в различни научни области е да се анализират тези данни и да се открият зависимости и характеристики на тези данни, да се групират по възможност общи техни признаци и на база свойствата на данните да се направят прогнози за следващи стойности в съвкупността от тези данни.

Наука за данните

Наука за данните и модерни информационни технологии – проф. д.м.н. Иван Иванов




Основни средства за анализ на тези данни са програмните езици R и Python. Наричат ги програмни езици, но те са много повече от такива. По своята същност това са нови информационни технологии, притежаващи програмни средства, готови програмни модули, разработени указания за използването на съществуващите им елементи. В тези платформи цели процеси и модели за обработка на данни се изпълняват с една команда. Освен това в тези технологии може да се програмира и да се моделират по-сложни процеси и анализи.

Голямо предимство при работа с тези средства R и Python е, че всичко се случва on-line, в интернет. Всички ресурси са с отворен достъп. Всеки може да твори и да програмира различни кодове за анализ на данни и да ги публикува в интернет. R и Python имат възможности за четене и зареждане на данни от интернет, от други сайтове, които генерират и съхраняват данни. Накратко R и Python са съвременни технологии за анализ на данни, изпреварващи с възможностите си всички съществуващи подобни средства. Намират широки приложение в различни реални области. Владеенето на тези нови технологии прави младите специалисти конкурентни на пазара на труда.