Дата Мининг

Шта је Дата Мининг:

Дата мининг је енглески термин повезан са компјутерском науком чији превод је дата мининг . Састоји се од функционалности која обједињује и организује податке, проналазећи у њима одговарајуће обрасце, асоцијације, промене и аномалије .

Појам дата мининг се први пут појавио 1990. године у заједницама база података. Дата мининг је корак анализе процеса познат као КДД (откривање знања у базама података ), његов дословни превод је "Откривање знања у базама података".

Рударство података може се поделити на неколико основних корака: истраживање, изградња модела, дефинисање узорка и валидација и верификација.

Рударство података је релативно новија пракса у свету рачунарства и користи проналажење информација, вештачку интелигенцију, препознавање узорака и статистичке технике за тражење корелација између различитих података који вам омогућавају да стекнете корисно знање за компанију или појединца. За компанију, дата мининг може бити важан алат који побољшава иновативност и профитабилност.

Употреба дата мининга је уобичајена у великим базама података, а крајњи резултат њихове употребе може се приказати кроз правила, хипотезе, стабла одлучивања, дендрограме итд.

Добро извршено рударење података требало би да изврши задатке као што су: откривање неправилности, учење асоцијације правила (моделирање зависности), кластерирање, класификација, регресија и сумирање. Процес дата мининга обично се дешава коришћењем података који се налазе у складишту података .

Постоји неколико компанија и софтвера који су посвећени рударству података, јер је идентификација образаца у базама података све важнија. Међутим, идентификација релевантних стандарда није јединствена у свету рачунара. Људски мозак користи сличан процес да би идентификовао обрасце и стекао знање.

У последњих неколико година, дата мининг се нашироко користи у областима науке и инжењерства, као што су биоинформатика, генетика, медицина, образовање и електротехника.

Концепт дата мининга се често повезује са извлачењем информација о понашању људи. Из тог разлога, у неким ситуацијама, рударење података покреће правна питања и питања која се односе на приватност и етику. Упркос томе, многи људи тврде да је дата мининг етички неутралан јер нема етичких импликација.

Примјери стварног прикупљања података

Рударство података се често користи од стране компанија и организација како би стекли знање о корисницима / запосленима / клијентима. На примјер, у јавном сектору могуће је унакрсно провјерити између брачног статуса запосленика и зараде коју он зарађује да би се видјело да ли то утјече на његов брачни живот.

Компаније као што су ланци супермаркета могу користити ове унакрсне податке како би одредили производе који се купују заједно. Ако купац који купи производ Кс купује и производ И, можда је добра идеја позиционирати два производа у близини како би купац лакше купио.