Articles

Pojmenovaná entita

při extrakci informací je pojmenovaná entita objektem reálného světa, jako jsou osoby, lokality, organizace, produkty atd., které lze označit vlastním jménem. Může být abstraktní nebo mít fyzickou existenci. Mezi příklady jmenovaných subjektů patří Barack Obama, New York City, Volkswagen Golf nebo cokoli jiného, co lze pojmenovat. Pojmenované entity lze jednoduše považovat za entitní instance (například New York City je instance města).

Z historického hlediska, termín Pojmenované Entity byl vytvořen během MUC-6 vyhodnocení kampaně a obsažené ENAMEX (subjekt jméno výrazy, např. osoby, místa a organizace) a NUMEX (číselné vyjádření).

formálnější definici lze odvodit z rigidního označení Saula Kripkeho. Ve výrazu „pojmenovaná entita“ má slovo „pojmenované“ za cíl omezit možnou sadu entit pouze na ty, pro které jeden nebo mnoho rigidních označovatelů znamená referent. Označení je tuhé, když označuje totéž v každém možném světě. Naopak, ochablí označení mohou označovat různé věci v různých možných světech.

jako příklad zvažte větu „Trump je prezident Spojených států“. Jak „Trump“, tak „Spojené státy“ jsou pojmenovány entitami, protože odkazují na konkrétní objekty (Donald Trump a Spojené státy). „Prezident“ však není pojmenovaná entita, protože může být použita k označení mnoha různých objektů v různých světech(v různých prezidentských obdobích odkazujících na různé osoby nebo dokonce v různých zemích nebo organizacích odkazujících na různé lidi). Tuhé označení obvykle obsahují vlastní jména a určité přírodní pojmy, jako jsou biologické druhy a látky.

existuje také obecná shoda v komunitě rozpoznávání jmenovaných entit považovat za pojmenované entity Časové a numerické výrazy, jako jsou částky peněz a jiné typy jednotek,které mohou porušovat rigidní perspektivu označení.