RO  EN
IMI/Noutăţi/2013/

Susţinerea tezei de doctor

Se anunţă susţinerea tezei de doctor în informatică:

Pretendent: Curteanu Neculai, cerc. șt. superior, Institutul de Informatică Teoretică, Iași, România.

Conducător ştiinţific: dr. hab. Svetlana Cojocaru, Institutul de Matematică şi Informatică al AŞM.

Consiliul ştiinţific specializat: DH 01 01.05.01-03 din cadrul Institutului de Matematică şi Informatică al AŞM.

Tema tezei: "Parsarea limbajului natural bazată pe strategia şi teoria lingvistică Segmentare-Coeziune-Dependenţă".

Specialitatea: 01.05.01 – Bazele teoretice ale informaticii, programarea calculatoarelor.

Data: 13 noiembrie 2013.

Ora: 14:00.

Local: Institutul de Matematică şi Informatică al AŞM, sala de conferinţe, bir. 340 (etajul III).

Principalele publicaţii ştiinţifice la tema tezei ale autorului (se indică monografiile, articolele ştiinţifice în reviste ştiinţifice de profil):

Rezultatele obţinute sunt publicate într-o monografie şi 46 de lucrări ştiinţifice.

Monografie:

Curteanu, N. The Segmentation-Cohesion-Dependency Parsing Strategy and Linguistic Theory, TehnoPress, Iaşi, România, 2012, 428 p. ISBN: 987-973-702-928-7.

Articole:

  1. Butnariu Cristina, Curteanu Neculai, Cecilia Bolea. Levels of Finite Clause Parsing: Implications and Applications. Memoriile Secţiilor Ştiinţifice / Memoirs of the Scientific Sections, Series IV, Tome XXXIV, ISSN: 1224-1407, 2011, pp. 41-54.
  2. Curteanu Neculai. Towards a Functional X-bar Theory. In the volume "The Romanian Language in the Informational Society", Dan Tufiş, F. Filip (Eds.), Edited by the Romanian Academy, Research Institute for Artificial Intelligence, Bucharest, 2002, pp. 51-86 (in Romanian).
  3. Curteanu N., Trandabăţ D., Moruz M. A.. Topic-Focus Articulation Algorithm on the Syntax-Prosody Interface of Romanian. Proceedings of TSD-2007 (Text, Speech and Dialogue) Conference, Plzen, Czech Republic, Springer Verlag, Berlin, Lecture Notes in Computer Science, No. 4629, 2007, pp. 516-523.
  4. Curteanu N., Moruz A., Trandabăţ D.. Extracting Sense Trees from the Romanian Thesaurus by Sense Segmentation & Dependency Parsing. Proceedings of COGALEX-I Workshop: Cognitive Aspects of the Lexicon: Enhancing the Structure, Indexes and Entry Points of Electronic Dictionaries, COLING 2008, Manchester, Great Britain, ISBN 978-1-905593-56-9, 2008, pp. 55-63.
  5. Curteanu N., Trandabăţ D., Moruz A.. Expanding Topic-Focus Articulation with Boundary and Accent Assignment Rules for Romanian Sentence. Vaclav Matousek, Pavel Mautner et al.(Eds.), Proceedings of the 12th International Conference TSD-2009, Plzen, Czech Republic, Lecture Notes in Computer Science, No. 5729, 2009, pp. 226-233.
  6. Curteanu N., Trandabăţ D., Moruz A.. An Optimal and Portable Parsing Method for Romanian, French, and German Large Dictionaries. Proceedings of COGALEX-II Workshop, COLING-2010, Beijing, China, ISBN: 978-7-302-23456-2, 2010, pp. 38-47.
  7. Curteanu Neculai, Alex Moruz. Toward the Soundness of Sense Structure Definitions in Thesaurus-Dictionaries. Parsing Problems and Solutions. Computer Science Journal of Moldova, Academy of Sciences of Moldova, Vol. 20, No.3 (60), 2012, pp. 275-303, http://www.math.md/files/csjm/v20-n3/v20-n3-(pp275-303).
  8. Curteanu Neculai, Alex Moruz. A Procedural DTD Project for Dictionary Entry Parsing Described with Parameterized Grammars. COGALEX-III – The Third Workshop on Cognitive Aspects of the Lexicon, COLING-2012, Bombay, India, 2012, pp. 127-136.
  9. Curteanu Neculai, Alex Moruz, Svetlana Cojocaru. Steps to a New DTD and SCD-based Dictionary Entry Parser. Optimizing Recursiveness in Sense Dependency Hypergraphs. Proceedings of the Workshop on Linguistic Resources and Instruments for Romanian Language Processing, ConsILR-2013, Miclăuşeni-Iaşi, The Editorial House of ”Al. I. Cuza” University, Iaşi, ISSN 1843-911X, 2013, pp. 119-130.
  10. Popârda O., N. Curteanu. L'évolution du discours juridique français analysé par la stratégie linguistique SCD. In the volume "Representations du Sens Linguistique", Lagorgette, P. Larrivée (Eds.), LINCOM Europa, series Studies in Theoretical Linguistics, München, Germany, 2002, pp. 487-502.

Rezumatul tezei:

Studiul realizat în teză ţine de un domeniu foarte actual de cercetare, parsarea limbajului natural, cu aplicaţii multiple în procesarea textelor şi analiza vorbirii pentru limbajul natural.

Scopul lucrării este de a dezvolta metoda generală de parsare cu configuraţii SCD, bazată pe teoria lingvistică SCD, şi de a aplica noua metodă de parsare pe texte narative din română şi engleză, precum şi pe marile dicţionare-tezaur ale limbilor română, franceză, germană şi rusă.

Obiectivele cercetării prevăd: definirea şi aplicarea metodei de parsare cu configuraţii SCD, la nivel de clauză şi de discurs, pe corpusuri de texte narative din limba română, precum şi parsarea marilor dicţionare-tezaur din limbile română, franceză, germană şi rusă; dezvoltarea teoriei lingvistice SCD, special proiectată pentru parsarea limbajului natural, inclusiv pentru metoda SCD; definirea teoriei FX-bar de proiecţie funcţională pentru limba română şi aplicarea ei la parsarea Grupului Verbal şi a subgrupurilor verbale corespunzătoare în limba română.

Noutatea şi originalitatea ştiinţifică a tezei constau în propunerea unui cuplu format din noua teorie lingvistică SCD şi metoda de parsare cu configuraţii SCD. Cele două instrumente computaţionale sunt primele de acest fel dezvoltate pentru limba română, uşor de aplicat pentru clasa limbajelor indo-europene. În teoria lingvistică şi metoda de parsare SCD, accentul semantic nu mai cade pe categoriile sintactice majore, ca în metodele tradiţionale de parsare, ci pe clasele de marcheri lexicali şi sintagmatici, consideraţi ca delimitatori (boundaries) funcţionali ai structurilor textuale sintactico-semantice şi ai dependenţelor dintre aceste structuri.

Patru noi probleme ştiinţifice importante au fost rezolvate: dezvoltarea noii teorii lingvistice SCD; dezvoltarea metodei de parsare generale cu configuraţii SCD; parsarea completă a Grupului Verbal din limba română; şi modelarea lexicografică împreună cu parsarea prin metoda SCD a marilor dicţionare-tezaur din limbile română, franceză, germană şi rusă.

Semnificaţia teoretică şi valoarea aplicativă a lucrării rezidă din noutatea ştiinţifică a instrumentelor teoretice şi computaţionale dezvoltate de prezenta teză: noua teorie computaţional-lingvistică SCD şi metoda de parsare SCD asociată, ce repezintă o tehnologie generală de parsare a limbajului natural. Eficienţa metodei SCD a fost demostrată de performanţele programelor de parsare dezvoltate pentru corpusuri de texte narative (romănă şi engleză) şi pentru mari dicţionare-tezaur (română, franceză, germană şi rusă).

Implementarea rezultatelor ştiinţifice s-a făcut prin dezvoltarea şi aplicarea mai multor programe de segmentare şi parsare la discurs retoric si juridic, la clauză finită, la grup verbal pentru texte în limba română, precum şi dezvoltarea unui parser SCD de dicţionare, adaptabil pentru marile dicţionare-tezaur din limbile română, franceză, germană şi rusă.