Se anunţă susţinerea tezei de doctor în informatică:
Pretendent: Curteanu Neculai, cerc. șt. superior, Institutul de Informatică Teoretică, Iași, România.
Conducător ştiinţific: dr. hab. Svetlana Cojocaru, Institutul de Matematică şi Informatică al AŞM.
Consiliul ştiinţific specializat: DH 01 01.05.01-03 din cadrul Institutului de Matematică şi Informatică al AŞM.
Tema tezei: "Parsarea limbajului natural bazată pe strategia şi teoria lingvistică Segmentare-Coeziune-Dependenţă".
Specialitatea: 01.05.01 – Bazele teoretice ale informaticii, programarea calculatoarelor.
Data: 13 noiembrie 2013.
Ora: 14:00.
Local: Institutul de Matematică şi Informatică al AŞM, sala de conferinţe, bir. 340 (etajul III).
Principalele publicaţii ştiinţifice la tema tezei ale autorului (se indică monografiile, articolele ştiinţifice în reviste ştiinţifice de profil):
Rezultatele obţinute sunt publicate într-o monografie şi 46 de lucrări ştiinţifice.
Monografie:
Curteanu, N. The Segmentation-Cohesion-Dependency Parsing Strategy and Linguistic Theory, TehnoPress, Iaşi, România, 2012, 428 p. ISBN: 987-973-702-928-7.
Articole:
Rezumatul tezei:
Studiul realizat în teză ţine de un domeniu foarte actual de cercetare, parsarea limbajului natural, cu aplicaţii multiple în procesarea textelor şi analiza vorbirii pentru limbajul natural.
Scopul lucrării este de a dezvolta metoda generală de parsare cu configuraţii SCD, bazată pe teoria lingvistică SCD, şi de a aplica noua metodă de parsare pe texte narative din română şi engleză, precum şi pe marile dicţionare-tezaur ale limbilor română, franceză, germană şi rusă.
Obiectivele cercetării prevăd: definirea şi aplicarea metodei de parsare cu configuraţii SCD, la nivel de clauză şi de discurs, pe corpusuri de texte narative din limba română, precum şi parsarea marilor dicţionare-tezaur din limbile română, franceză, germană şi rusă; dezvoltarea teoriei lingvistice SCD, special proiectată pentru parsarea limbajului natural, inclusiv pentru metoda SCD; definirea teoriei FX-bar de proiecţie funcţională pentru limba română şi aplicarea ei la parsarea Grupului Verbal şi a subgrupurilor verbale corespunzătoare în limba română.
Noutatea şi originalitatea ştiinţifică a tezei constau în propunerea unui cuplu format din noua teorie lingvistică SCD şi metoda de parsare cu configuraţii SCD. Cele două instrumente computaţionale sunt primele de acest fel dezvoltate pentru limba română, uşor de aplicat pentru clasa limbajelor indo-europene. În teoria lingvistică şi metoda de parsare SCD, accentul semantic nu mai cade pe categoriile sintactice majore, ca în metodele tradiţionale de parsare, ci pe clasele de marcheri lexicali şi sintagmatici, consideraţi ca delimitatori (boundaries) funcţionali ai structurilor textuale sintactico-semantice şi ai dependenţelor dintre aceste structuri.
Patru noi probleme ştiinţifice importante au fost rezolvate: dezvoltarea noii teorii lingvistice SCD; dezvoltarea metodei de parsare generale cu configuraţii SCD; parsarea completă a Grupului Verbal din limba română; şi modelarea lexicografică împreună cu parsarea prin metoda SCD a marilor dicţionare-tezaur din limbile română, franceză, germană şi rusă.
Semnificaţia teoretică şi valoarea aplicativă a lucrării rezidă din noutatea ştiinţifică a instrumentelor teoretice şi computaţionale dezvoltate de prezenta teză: noua teorie computaţional-lingvistică SCD şi metoda de parsare SCD asociată, ce repezintă o tehnologie generală de parsare a limbajului natural. Eficienţa metodei SCD a fost demostrată de performanţele programelor de parsare dezvoltate pentru corpusuri de texte narative (romănă şi engleză) şi pentru mari dicţionare-tezaur (română, franceză, germană şi rusă).
Implementarea rezultatelor ştiinţifice s-a făcut prin dezvoltarea şi aplicarea mai multor programe de segmentare şi parsare la discurs retoric si juridic, la clauză finită, la grup verbal pentru texte în limba română, precum şi dezvoltarea unui parser SCD de dicţionare, adaptabil pentru marile dicţionare-tezaur din limbile română, franceză, germană şi rusă.