ОбразуванеСредно образование и училищата

Най-близкия съсед метод: пример за работа

най-близкия съсед метод е най-лесният метричен класификатор, който се основава на оценка на сходството на различни обекти.

Анализирани обект принадлежи към класа, към която принадлежат поданици на проба обучение. Нека да разберете кой е най-близкият съсед. Опитайте се да разберете сложната материя, образци на различни техники.

метод хипотеза

най-близкия съсед метод може да се счита за най-честата използвания алгоритъм за класификация. Обект подложени на класификация принадлежи y_i на класа, към който най-близкия обект учене x_i проба.

Спецификата на предлаганите методи близките съседи

к-близкия съсед метод може да подобри точността на класификация. Анализирани обект принадлежи към същия клас, като по-голямата част от своите съседи, тоест, в близост до к възразява на анализирана проба x_i на. В решаването на проблемите с два класа на броя на съседите ще бъде странно да се избегне ситуация на неяснота, ако един и същ номер на съседите ще принадлежат към различни класове.

Техниката на окачени съседи

PostgreSQL-анализира метод tsvector близкия съседи се използва, когато броят на класовете най-малко три, и не можете да използвате нечетен брой. Но неяснота възниква дори и в тези случаи. След това,-тото съсед получава w_i тегло, което намалява с съсед ранг аз. Тя се отнася към класа на обекта, който ще има най-много общо тегло сред близки съседи.

Хипотезата за компактност

В основата на всички по-горе методи, е хипотезата на компактност. Това предполага връзка между мярката на сходството на обектите и тяхната принадлежност към един и същи клас. В тази ситуация, на границата между различните видове е проста форма, и да се създаде класа обекти в пространството компактен мобилен област. При такива области, в математически анализ се разбира затворен ограничена серия. Тази хипотеза не е свързана с ежедневието възприемането на думата.

Основната формула

Нека разгледаме по-близкия съсед. Ако предложен обучение тип проба "обект-отговор» X ^ т = \ {(x_1, y_1), \ точки, (x_m, y_m) \}; ако множество предмети, за да се определи разстоянието функция \ Rho (х, х "), което е представено под формата на подходящ модел на сходство на обекти чрез увеличаване на стойността на функцията намалява сходство между обектите х, х".

За всеки обект, и ще се изгради проба обучение обекти x_i с увеличаване на разстоянията до ф:

\ Rho (ф, x_ {1; ф}) \ екв \ р (ф, x_ {2; ф}) \ екв \ cdots \ екв \ р (ф, x_ {m; ф}),

където x_ {I; ф} характеризира проба живот обект, който е и-ти съсед източник обект ф. Такава нотация и използване да отговори на аз-ти съсед: y_ {аз; ф}. В резултат на това ние откриваме, че всеки обект, ф провокира преномериране собствена проба.

Определяне на броя к на съседите

най-близкия съсед метод, когато к = 1 е в състояние да даде погрешна класификация, не само на обекти емисии, но и за други класове, които са в близост.

Ако вземем к = m, алгоритъмът да бъде толкова стабилна и ще се изроди в постоянна стойност. Ето защо надеждност е важно да се избягват екстремни обозначения к.

На практика, както се използва оптимално индекс к критерий плъзгащи контрол.

емисиите прожекции

Предметът на дейност проучване, до голяма степен са неравни, но сред тях има и такива, които имат характеристиките на един клас и са посочени като стандарти. В близост до обекта на идеалния модел на високо вероятността му за принадлежност към този клас.

Как rezultativen метод на най-близките съседи? Един пример може да се види на базата на периферните и не са информативни категории обекти. Предполага се, гъста среда на обекта и други представители на този клас. Когато ги премахнете от класирането на вземане на проби за качеството няма да пострада.

Влез в определен брой образци може шумови изблици, които са "на място" от един клас. Премахване съществено положително въздействие върху качеството на класирането.

Ако пробата от uninformative и премахване на шума обекти, можете да разчитате на няколко положителни резултати в същото време.

Първият в метода интерполация на най-близкия съсед класификация позволява да се подобри качеството, намаляване на количеството на съхраняваните данни, намаляване на времето на класификация, която се изразходва за избора на следващите стандарти.

Използването на ултра-големи проби

най-близкия съсед метод се основава на реално съхранение на учебните предмети. За създаване на много големи проби с помощта на технически проблем. Целта не е просто да спаси значително количество информация, но също така и в минимално количество време, за да имат време да се намери всеки обект ф к сред най-близките съседи.

За да се справи с тази задача, се използват два метода:

  • изтънената проба чрез обекти освобождаване без данни;
  • ефективно използване специална структура данни и кодове за бързо търсене на най-близките съседи.

Правилник за методи за подбор

Горната класификация се счита. Най-близък съсед метод се използва при решаване на практически проблеми, които се известни в предварително функция \ Rho разстояние (х, х "). В описващи обекти числови вектори използват евклидовата показател. Този избор не е специална обосновка, но включва измерване на всички знаци "в същия мащаб." Ако този фактор не се взема под внимание, а след това показателят ще преобладава функция като най-високите числови стойности.

Ако има значително количество функции, изчисляване на разстоянията като сумата от отклоненията на специфични симптоми се появи сериозно измерение проблем.

В разгара на тримерно пространство разстояние една от друга ще всички обекти. В крайна сметка, всеки проба ще бъде в непосредствена близост до обекта, който се изучава к съседи. избран малък брой информационни функции, за да се елиминира този проблем. Алгоритъм за изчисление на оценки изграждат въз основа на различни набори от знаци и за всеки отделен изградят близост функция.

заключение

Математически изчисления често включват използването на различни техники, които имат своите отличителни особености, предимства и недостатъци. Гледан най-близкия съсед метод може да реши доста сериозен проблем, поради характеристиките на математически обекти. Експерименталната концепция, въз основа на анализ метод се използва активно в изкуствения интелект.

В експертните системи, е необходимо не само да се класифицира обекти, но и да му показва обяснение на въпросната квалификация. При този метод, обяснение на това явление са изразени по отношение на предмета на конкретен клас, както и неговото местоположение по отношение на използваната проба. Правни индустрията специалисти, геолози, лекари, да приемат този "прецедент" логика активно да го използвате в своите изследвания.

С цел да бъдат анализирани метод е най-надеждна, ефективна, давайки желаните резултати, трябва да вземете минимална цифра к, като същевременно се избегнат емисиите сред анализираните обекти. Ето защо използването на стандартите и начина на подбор, както и показателите за оптимизация.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 bg.atomiyme.com. Theme powered by WordPress.