पद-निर्धारण (
Tagging)
'पद-निर्धारण' का तात्पर्य एक नियत टैग-सेट के आधार पर भाषा में शब्द-वर्गों के आधार पर अलग-अलग पदों का मशीन द्वारा स्वत: पहचान करने से होता है। इसमें टैग-सेट
का निर्धारण पहले से करना होता है, तदनुसार ही आउट-पुट की अपेक्षा होती है।
प्राकृतिक भाषा संसाधन में भाषाई विश्लेषण की प्रारम्भिक प्रक्रिया होती है, इसके बाद ही आगे की इकाईयों पदबंध, उपवाक्य एवं वाक्य आदि का विश्लेषण होता है। इस
प्रक्रिया से एक तरह से आगे के सभी विश्लेषणों का आधार तैयार होता है। इसी आधार पर मशीनी अनुवाद, सूचना-संचयन एवं प्रत्यानयन तथा प्रोक्ति-विश्लेषण आदि का कार्य
होता है।
टैग-सेट
टैग-सेट इस प्रक्रिया का केंद्रीय विषय है, क्योंकि इसी के आधार पर न सिर्फ पद-निर्धारण का कार्य होता है, बल्कि परिणाम का विश्लेषण एवं आगे का संसाधन भी होता
है। यह मूलत: शब्द-वर्गों के आधार पर एक तरह का टोकन होता है, जिसके आधार कंप्यूटर की कोडिंग भी हो सके और मानवीय-परीक्षण में भी सहयोगी हो। जैसे-
क्र. सं.
|
टैग
|
पूर्ण नाम
|
उदाहरण
|
संज्ञा (
Noun)
|
1.
|
NAB
|
Abstract Noun
|
दर्द, नींद, हँसी, सदमा, खुशी
|
2.
|
NCD
|
Cardinal Noun
|
एक, दो, हजार, लाख, करोड़
|
3.
|
NCM
|
Common Noun
|
मेज, विद्यालय, जहाज, घर
|
4.
|
NCN
|
Compound Noun
|
माता-पिता, राम-श्याम, राजा-रानी
|
5.
|
NNPA
|
Proper Noun (Authority)
|
प्रधानमंत्री, भारतीय भाषा संस्थान, मणिसाना आयोग
|
6.
|
NNPL
|
Proper Noun (Place)
|
दिल्ली, हिमालय
|
7.
|
NNPP
|
Proper Noun (Person)
|
रहीम, वहीदा
|
सर्वनाम
(Pronoun)
|
8.
|
PCP
|
Reciprocal
|
एक-दूसरे, आपस में
|
9.
|
PDE
|
Indefinite
|
कोई, कुछ, कई, अनेक, किसी
|
10.
|
PDM
|
Demonstrative
|
यह, वह, ये, इसने, यही, इतना, उतना
|
11.
|
PIT
|
Interrogative
|
कौन, क्या, क्यों, कहाँ, कैसे, किस
|
12.
|
POS
|
Possessive
|
मेरा, मेरी, उसका, उसकी, उसके, उनका, उनके
|
13.
|
PRD
|
Ordinals
|
पहली, दूसरी, तीसरी, दसवीं, पहला, दूसरा
|
14.
|
PRE
|
Relative
|
जो, जिस, जिसपर, जिससे, जिनसे, जिन्हें, जिन्होंने
|
15.
|
PRF
|
Reflexive
|
स्वयं, खुद, अपने-आप, निज
|
16.
|
PRL
|
Personal
|
मैं, तुम, आप, हम, मुझे
|
क्रिया
(Verb)
|
17.
|
VAUX
|
Auxiliary Verb
|
रहा_है, चुका_था, होगा
|
18.
|
VCT
|
Single Causative Verb
|
पढ़ाया, पहुँचाया, खिलाया, दौड़ाया
|
19.
|
VDC
|
Double Causative Verb
|
पढ़वाया, पहुँचवाया, हँसवाया
|
20.
|
VMAIN
|
Main Verb Finite
|
पढ़, लिख, खा, पी, रो, सो
|
21.
|
VNF
|
Non Finite Verb
|
खाते_हुए, पीते_हुए, रोते_हुए, हँसकर, चलकर
|
विशेषण
(Adjective)
|
22.
|
ADJ
|
Adjective
|
अच्छा, बुरा, बड़ा, सुंदर, चतुर
|
क्रिया-विशेषण
(Adverb)
|
23.
|
ADV
|
Adverb
|
सहसा, अचानक, कल, अब
|
अन्य कोटियाँ
(Other Categories)
|
24.
|
CNJ
|
Conjunction
|
और, या, व
|
25.
|
DLC
|
Discourse Locater
|
उपर्युक्त, उपरोक्त, उक्त, निम्नलिखित, निम्नोक्त, निम्नांकित
|
26.
|
DNC
|
Sentence Connecter
|
अगर, अर्थात्, इसलिए, कि, तो, दरअसल, बल्कि, यदि
|
27.
|
IND
|
Indeclinable
|
बिना, सिवा, आदि, भले
|
28.
|
INJ
|
Interjection
|
हाय! हे! ओह! अजी! ओहो!
|
29.
|
ITF
|
Intensifier
|
बहुत, बेहतर, ज्यादा
|
30.
|
LOC
|
Location
|
नीचे, ऊपर, सामने, बाहर
|
31.
|
NEG
|
Negative
|
न, नहीं, मत
|
32.
|
PRT
|
Particle
|
भी, तो, भर, ही, तक
|
33.
|
PSP
|
Post Position
|
ने, को, के_द्वारा, के_लिए, के_अनुकूल
|
34.
|
PUC
|
Punctuation
|
।
|
35.
|
QOT
|
Quotative
|
माने, मतलब, दरअसल, यानी
|
36.
|
QTF
|
Quantifier
|
लगभग, करीब, सैकड़ा
|
37.
|
QTN
|
Question
|
?
|
38.
|
RDP
|
Reduplication
|
घर-घर, धीरे-धीरे
|
39.
|
SEP
|
Separator
|
, ;
|
गुण (
Attribute) : (A)
लिंग (
Gender)
|
40.
|
MAS
|
Masculine
|
उसका
|
41.
|
FEM
|
Feminine
|
उसकी
|
42.
|
MFN
|
Masculine + Feminine
|
उसको
|
(B)
वचन (
Number)
|
43.
|
SGR
|
Singular
|
इस
|
44.
|
PLR
|
Plural
|
इन
|
45.
|
SPR
|
Singular + Plural
|
जो, वो
|
(C)
पुरुष (
Person)
|
46.
|
FST
|
First Person
|
मैं
|
47.
|
SND
|
Second Person
|
तू
|
48.
|
TRD
|
Third Person
|
वह
|
(D)
आदरार्थकता (
Honorificity)
|
49.
|
HON
|
Honorific
|
आप
|
50.
|
NHN
|
Non-honorific
|
तुम
|
(E)
प्रकार्य (
Function)
|
51.
|
ANI
|
Animate
|
मैं
|
52.
|
INE
|
Inanimate
|
जब
|
53.
|
LOT
|
Locative
|
वहाँ , कहाँ
|
54.
|
TMR
|
Time Marker
|
कब, जब
|
55.
|
CPR
|
Comparison
|
जैसा, वैसा
|
(F)
गणनीयता (
Countability)
|
56.
|
CTA
|
Countable
|
अनेक
|
57.
|
UCT
|
Uncountable
|
कुछ
|
(G)
प्रस्थिति (
Position)
|
58.
|
PRX
|
Proximal
|
यह
|
59.
|
DIS
|
Distal
|
वह
|
(H)
प्रभावता (
Emphaticity)
|
60.
|
EMP
|
Emphatic
|
वही
|
61.
|
NMP
|
Non-Emphatic
|
वह
|
(I)
वितरण (
Distribution)
|
62.
|
DST
|
Distributive
|
कुछ-कुछ
|
63.
|
NDS
|
Non-Distributive
|
कई
|
(J)
कारक (
Case)
|
64.
|
DRT
|
Direct
|
यह
|
65.
|
OBQ
|
Oblique
|
इसके
|
(K)
कारक चिह्नक (
Case Marker)
|
66.
|
NOM
|
Nominative
|
वह, वो, वे
|
67.
|
ERG
|
Ergative
|
उसने, उन्होंने
|
68.
|
ACC
|
Accusative
|
उसे, उसको, उन्हें, उनको
|
69.
|
INS
|
Instrumental
|
उससे, उसके द्वारा, उनसे, उनके द्वारा
|
70.
|
DAT
|
Dative
|
उसे, उसको, उसके लिए, उनको, उन्हें, उनके लिए
|
71.
|
ABL
|
Ablative
|
उससे, उनसे
|
72.
|
GEN
|
Genitive
|
उसका, उसकी, उसके, उनका, उनकी, उनके
|
73.
|
LOT1
|
Locative First
|
उसमें, उनमें, हममें
|
74.
|
LOT2
|
Locative Second
|
उस पर, उन पर, हम पर
|
काल (
Tense)
|
75.
|
PST
|
Past Tense
|
गया
|
76.
|
PNT
|
Present Tense
|
जाता
|
77.
|
FUT
|
Future Tense
|
जाएगा
|
|
|
|
|
|
|