imkanlar
08
May 2020
Yapay Zekâya Türkçe Dokunuş

Fakültemizin öğretim üyelerinden Doç. Dr. Gülşen Cebiroğlu Eryiğit'in önderliğinde çalışmalarına devam eden Doğal Dil İşleme Araştırma Grubu ile ilgili İTÜ sayfasında yayınlanan haber metni aşağıda yer almaktadır. Hocamızı ve grup üyelerini tebrik ediyor, başarılarının devamını diliyoruz.


"İstanbul Teknik Üniversitesi Doğal Dil İşleme Grubu, bu alanda uzmanlaşmış, Türkiye’deki en eski ve en büyük dil teknolojileri grubudur. 2000 yılında kurulan grup, halen İTÜ Bilgisayar ve Bilişim Fakültesi bünyesinde faaliyetlerini yürütüyor. Doç. Dr. Gülşen Eryiğit’in koordinatörlüğü üstlendiği grupta hâlihazırda 3 öğretim üyesi, 5 araştırma görevlisi ve 30’a yakın doktora, yüksek lisans ve gönüllü lisans öğrencisi bulunuyor. Şu ana kadar 12 bilimsel araştırma projesi yürütülen, 8 TEYDEB projesinin öneri ve yürütülmesi aşamalarında grup öğretim üyeleri ve araştırmacıları tarafından akademik desteklerin sağlandığı merkez, tam bir Ar-Ge üssü gibi çalışıyor.

İstanbul Teknik Üniversitesi Doğal Dil İşleme Grubu’nu, çalışmalarını ve hedeflerini grubun koordinatörlüğünü yürüten Doç. Dr. Gülşen Eryiğit’e sorduk.

Türkçede doğal dil işleme projeleri üzerine çalışmalar yürütüyorsunuz. Türkçenin önemi nedir?

Günümüzde yapay zekanın en popüler çalışma alanlarından biri olarak karşımıza çıkan doğal dil işleme, Türkçe özelinde pek çok yeni problemle birlikte, bu problemlere çözümler üretecek araştırmacılara ve öğrencilere fırsatları da beraberinde getiriyor. Sondan eklemli ve biçim bilimsel yönden çok zengin bir dil olan Türkçe, yapısı itibari ile doğal dil işleme alanında üzerinde en çok çalışılan dil olan İngilizceden çok farklıdır. Bu nedenle İngilizce üzerine geliştirilen yeni teknikler Türkçeye doğrudan uygulanmaya çalışıldığında İngilizcede gösterdikleri başarımları gösterememektedir. Türkçe bu farklı yapısı itibari ile sadece ulusal araştırmacıların değil uluslararası araştırmacıların da dikkatini çekiyor. Türkçe üzerine geliştirilen algoritmalar benzer şekilde biçim bilimsel zenginlik içeren pek çok dil için örnek oluşturuyor. Türkçe, 83 milyon konuşanı ile dünyada 20’nci sırada yer alıyor. Türk dilleri ise yaklaşık 12 milyon kilometrekarelik alanda 200 milyondan fazla insanın konuştuğu diller olarak öne çıkıyor.

Laboratuvar çatısı altında yürütülen projelerin ekonomik boyutu ve pazar hedefi konusunda neler söylersiniz?

Doğal Dil İşleme, tüm dünyada yapay zekanın en zorlu alanlarından biri olarak görülüyor. Dünyadaki en güncel teknikleri yakından takip eden İTÜ DDİ Grubu, en önemli misyonunu Türkçenin yapısı itibari ile DDİ alanında ortaya koyduğu ilave zorluklara çözümler üretmek olarak belirlemiştir. Bu misyon ile oluşturduğu yaklaşımlar hem endüstriyel pek çok çalışmaya hem de farklı disiplinlerdeki araştırmacıların çalışmalarına hızlı şekilde katma değer sağlıyor. Grup öğretim üyeleri tarafından, İTÜ ARI Teknokent’te yer alan pek çok firmaya ve Ar-Ge merkezine akademik danışmanlık veriliyor. ABD’de gerçekleştirilen ilk lisanslama 2016 yılında İTÜNOVA TTO tarafından, İTÜ Doğal Dil İşleme Yazılım zinciri ile gerçekleştirildi. Ekip, doğal dil işleme alanında ürettiği farklı projeler ile hem ulusal hem de uluslararası firmalar için kritik öneme sahip bilgi birikimi oluşturuyor.

Araştırma grupları tarafından yürütülen projeleri ve öne çıkan projeleri öğrenebilir miyiz?

Türkçe doğal dil işleme üzerine farklı seviyelerde araştırmalar yürüten ve bu araştırma çıktılarının Telekom, bankacılık, hukuk, otomotiv gibi çeşitli sektörlere uygulamalarına yoğunlaşan grubun üyelerinin yer aldığı araştırma projelerinden bazıları şöyledir;

• Web2.0 Cümlelerinin Ayrıştırılması, TÜBİTAK, 2013-2015 (TÜBİTAK Proje Performans Ödülü)

• Türkçeden - Türk İşaret Diline Otomatik Çeviri Sistemi ve Avatar Animasyonu,(TÜBİTAK, 2014-2016)

• Akıllı Telefon ve Tabletler Üzerinde Türkçe Kişisel Asistan Uygulaması, (T.C. Bilim Sanayi ve Teknoloji Bakanlığı SANTEZ, 2013-2014)

• Türkçenin Bağlılık Çözümlemesi, (İTÜ BAP, 2005-2007)

• Türkçe-İngilizce (2011-2013) ve Türkçe-Türkmence (2006-2009) Makine Çevirisi

Üniversite-sanayi iş birliği kapsamında endüstriye yönelik projelerden birkaç örnek paylaşır mısınız?

Yıllar içerisinde kuvvetli endüstriyel ilişkiler geliştirmiş olan grup, üniversite-sanayi iş birliği çerçevesinde pek çok endüstri odaklı projede yer aldı ve almaya devam ediyor. Bu projelerden bazıları “Otomotiv Destek Kanalları Diyalog Sistemi”, “Telekom Alanında Hedefe Dayalı Duygu Analizi”, “Gürültülü Bankacılık Metinleri Üzerinden Bilgi Çıkarımı”, “Bankacılık Diyalog Sistemleri” ve “Hukuksal Dokümanlar üzerinde Metin Analizi” olarak sıralanabilir.

Grup doğal dil işleme alanında çalışan araştırmacılara pek çok Türkçe doğal dil işleme temel seviye aracını (metin normalizasyonu, sözcük çözümleyici, cümle çözümleyici, vb.) sağlıyor. Bunlardan bazıları aynı zamanda tools.nlp.itu.edu.tr adresi üzerinden web servis olarak hizmet veriyor. Benzer şekilde grup tarafından üretilen pek çok önemli veri kümesi (Türkçe Ağaç Yapılı Derlemler, çok sözcüklü terim ve varlık ismi kaynakları, Türk işaret dili kaynakları, vb.) aynı adres üzerinden araştırmacılar ile paylaşılıyor.

İTÜ DDİ Grubu, UD (Universal Dependencies), CLARIN (Common Language Resources and Technology Infrastructure, EU 7th Framework), PARSEME (Parsing and Multiword Expressions, European Cost Action IC1207) ve EnetCollect (European Network for Combining Language Learning with Crowdsourcing Techniques, European Cost Action CA16105) gibi pek çok Avrupa Birliği projesinde aktif olarak rol almış ve almaya devam ediyor. İTÜ DDİ Laboratuvarı, 2020 Ocak ayında ENETCOLLECT aksiyonu tarafından ayın laboratuvarı olarak seçildi.

Yurt içi ve yurt dışı iş birliklerine de değinebilir misiniz?

İTÜ Doğal Dil İşleme Grubu, aktif rol aldığı pek çok Avrupa Birliği aksiyonu ve geçmişten günümüze yürüttüğü uluslararası iş birlikleri neticesinde pek çok uluslararası ortak yazarlı yayına imza attı. Mezun ettiği pek çok araştırmacı, Avrupa ve ABD’de farklı araştırma kuruluşlarında çalışmaya başladı. Özellikle Türki Cumhuriyetlerdeki doğal dil işleme araştırmacılarına destek vermeyi bir sorumluluk olarak benimseyen grubumuz, Türkçe üzerinde edindiği deneyimlerini diğer Türki dillere aktarma gayretindedir http://ddi.itu.edu.tr/araclarkaynaklar adresinde derlediği Türkçe ve Türki Dillere ait veri kaynakları pek çok araştırmacıya hizmet ediyor.

Ekip yurtiçinde de başta dilbilim ve robotik olmak üzere pek çok farklı disiplinden grupla iş birlikleri yaparak ortak projeler yürütüyor. İTÜ DDİ, yıllar içerisinde geliştirdiği pek çok veri kümesini ve doğal dil işleme aracını tüm araştırmacıların hizmetine açarak Türkçe Doğal Dil İşleme konusunda dünyada ve ülkemizde öncü çalışma grubu haline geldi.

İTÜ DDİ Araştırma Grubu olarak hangi ödülleri aldınız? 

-TÜBİTAK Proje Performans Ödülü, 2018

- İTÜ Şükran Plaketi - Akademik Başarı “ITUNOVA TTO’dan ABD’ye ilk lisanslama”, Aralık 2016

- TÜBİTAK H2020 Proje Başvurusu Eşik Üstü Ödülü, Kasım 2015

- İTÜ Şükran Plaketi - AB 7. Çerçeve Programı ve Araştırma Altyapılarına Katkı, Ocak 2012

- 2 adet Siemens Mükemmellik Ödülü, Haziran 2007

- ``CoNLL-XI Shared Task: Multi-lingual Dependency Parsing'' yarışması birinciliği, Haziran 2007

- ``CoNLL-X Shared Task: Multi-lingual Dependency Parsing'' yarışması birinciliği, Haziran 2006

Doç.Dr. Gülşen Eryiğit Hakkında

İstanbul Teknik Üniversitesi (İTÜ) Bilgisayar ve Bilişim Fakültesi öğretim üyesi olan Doç. Dr. Gülşen Eryiğit, İTÜ Doğal Dil İşleme Grubu’nun kurucu üyesi ve yöneticisidir. Yüksek lisans ve doktora derecelerini 2002 ve 2007 yıllarında İTÜ Bilgisayar Mühendisliği Bölümünden almıştır. 2006 yılında İsveç Vaxjö Üniversitesi’nde ziyaretçi araştırmacı olarak bulunmuş ve çalıştığı grup ile CoNLL (doğal dil öğrenme konferans serisi) 2006 ve 2007 çok-dilli bağlılık ayrıştırması çalıştaylarında birinci olarak seçilen çalışmalarda yer almıştır. 2007 yılında doktora çalışmaları nedeni ile Siemens Mükemmeliyet Ödülü’ne laik görülmüştür. Araştırmacı, pek çok prestijli dergi ve konferansta yazar ve hakem olarak görev almıştır. 2020 itibari ile Google Scholar’da 3000’in üzerinde atıf sayısına sahiptir.

Avrupa Birliği CLARIN (EU 7th Framework Programme, CLARIN - Common Language Resources and Technology Infrastructure) projesinde Türkiye temsilcisi olarak yer almıştır. Bunun yanı sıra yakın geçmişte pek çok AB (Cost), TÜBİTAK (1001 ve 1003) ve T.C. Sanayi Bakanlığı (Santez) destekli projede yürütücülük ve araştırmacılık yapmış, 6 TÜBİTAK TEYDEB destekli projede danışman olarak görev almıştır. Aynı zamanda bu fonlama kuruluşlarında (AB H2020, Cost Aksiyonu programları, TÜBİTAK, T.C. Sanayi Bakanlığı) hem araştırma hem endüstriyel proje önerilerinde hakemlik ve izleyicilik yapmaktadır. Ulusal ve uluslararası araştırmacıların hizmetine sunduğu Türkçe Doğal Dil İşleme Web Servisleri (tools.nlp.itu.edu.tr) 2020 yılı itibari ile 200’ün üzerinde araştırmacıya hizmet vermektedir.