Alexa anla beni

Sesle kumanda edilen AI (yapay zeka) cihazları inanılmaz bir hızla ilerliyor. Önümüzdeki dönemde hayatımıza dokundukları alanlar da çeşitleneceğe benziyor...

29.11.2017 11:52:000
Paylaş Tweet Paylaş
Alexa anla beni

31 Ağustos 2012 tarihinde Amazon’dan dört mühendis dünyanın en büyük ve en karmaşık veri setlerinden biri olan insan konuşmasıyla bağlantı kurmak için tasarlanmış bir yapay zeka sistemine yani Alexa’ya dönüşecek önemli bir patentin tescilini yaptırdı. Alexa’nın nasıl çalışacağını tanımlamak için bu mühendisler sadece 11 kelimeye ve basit bir diyagrama ihtiyaç duydu. Sessiz bir odada erkek bir kullanıcı şöyle konuştu: “Lütfen Beatles’dan ‘Let It Be’yi çal.” Masaüstü küçük bir makine ise şöyle cevap verdi: “Sorun değil John” ve istenilen şarkıyı çalmaya başladı. Evlere yönelik sesle kumanda edilen AI işte bu mütevazı başlangıçtan evrimleşerek Amazon’un teknolojik rakipleriyle kapıştığı stratejik bir savaş alanına dönüştü. Google, Apple, Samsung ve Microsoft gibi şirketlerin hepsi tüketicilerin onlarla konuşabileceği ve kullanımı kolay cihazların sürümlerini yaratmak için binlerce iş uzmanını ve araştırmacıyı işe alıyor. Bankalar, üniversiteler, avukatlık büroları ve diğerleri için her türlü sesle çalışan uygulama yazan Witlingo’nun CEO’su Ahmed Bouzid, “Yazma, tıklama veya okutma anlamında bugüne kadar hep biz teknolojiyi anlamaya çalışıyorduk. Şimdi ise yeni kullanıcı arayüzleri bizi anlamaya çalışıyor” diyor. Amazon için daha iyi bir müzik kutusuna yönelik bir platform olarak başlayan bu iş artık çok daha büyük bir şeye dönüştü: İnsan verileri üzerine kurulu ve sürekli onlardan öğrenen bir yapay zeka (AI) sistemine. Bugün ışıkları açıp kapatabilen, fıkralar anlatabilen veya ellerinizi kullanmaksızın size gazete haberlerini okuyabilen, Alexa ile çalışan Echo silindir ve minnacık Dot gibi her yerde bulunabilen ev içi asistanlar var. Bu asistanlar Alexa’nın daha da geliştirilebilmesi ve kullanım alanlarının artması için kendi kullanıcıları hakkında yığınla veri de topluyor. 2014 yılında pazara sürüldüklerinden bu yana Alexa ile çalışan 10 milyonlarca makine satıldı. Amazon ABD’deki sesle kumanda edilen AI cihazları pazarında birim satışların yaklaşık yüzde 70 oranında artacağına inanıyor, yani rekabet fevkalade kızışacağa benziyor. Bu arada Google Home milyonlarca birim satış gerçekleştirirken Apple ile Microsoft da kendi sürümlerini çok yakında piyasaya çıkaracak. Asıl ödül ise üç önemli pazarı kontrol altına almak veya en azından bu pazarları etkilemekte yatıyor. Bunlar; ev otomasyonu, ev eğlencesi ve alışverişi… Bugün kaç kişinin buzdolabıyla konuşmak isteyebileceğini bilmek zor. Ancak şu da bir gerçek ki günlük yaşam alışkanlıkları hızlı şekilde değişiyor. Nasıl akıllı telefonlar randevulaşma kurallarından, yayaların yürüme hızlarına kadar her şeyi değiştirdiyse sesle kumanda edilen AI de ev yaşamımızı değiştirmeye başlıyor. Alexa veya onun bir muadili varken akşam ön kapıyı kilitlemek ya da kışın buz gibi soğuk bir günde dışardaki arabanın kaloriferini çalıştırmak için neden salondaki rahat koltuğumuzdan kalkalım ki? Amazon, Alexa ile çalışan akıllı termostatlar, ampuller ve diğer türden cihazlar üreten şirketlerden şimdilik gelir tahsil etmeye çalışmıyor. Ancak ileride gelir paylaşım düzenlemeleri veya diğer ödeme türlerini ortaya çıkarabilecek yöntemleri hayal etmek hiç de zor değil. Bu üç pazardan en küçüğü olan ev otomasyonu daha şimdiden yılda 5 milyar dolardan fazla harcama hacmine ulaşmış durumda. ABD’de geçen yıl perakende satışlar 4,9 trilyon doları buldu. Bugün Amazon Dot’lar için 50 dolar ve video ekranlı en pahalı Echo’lar için 230 dolar fiyat koyuyor. Bu makinelerin kendilerinden para kazanıyor ve kullanıcının alışverişini Amazon’un uçsuz bucaksız çevrimiçi mağazasında yapması durumunda ise ikinci bir kazanç daha elde ediyor. Ancak Amazon bu trafik rakamlarını halka açıklamıyor. 

AMAZON GELİŞTİRİCİLERİ TEŞVİK EDİYOR

Echo’nun akıllı telefonlar kadar yaygınlaşabilmesi için çok daha fazla işi yapabilir duruma gelmesi gerekiyor. Amazon bu maksatla tıpkı Apple’ın uzunca bir süredir uygulama (app) geliştiricilerle yaptığı gibi bağımsız geliştiricileri bu platform üzerinde yeni servisler yaratmaya teşvik ediyor. Bugüne kadar bu şekilde 15 binden fazla uygulama geliştirildi ve uygulama geliştirme araçlarının birleştirilmesi artık o kadar kolaylaştırıldı ki bugün çok fazla yazılım deneyimi olmaksızın bile sadece bir saat içinde yeni bir app geliştirmek mümkün hale geldi. En popüler uygulamalar arasında ise Uber ve Lyft’in kaçak taksi çağırma seçenekleri var. Başarısız olanları ise dinleyicilere aşağılamalar yağdıran 48 farklı uygulama içeriyor. En iddialı geliştiriciler arasında Alexa ile birlikte çalışabilen donanım üreten veya servisler satan şirketler var. Örneğin Capital One adlı şirket bankacılık müşterilerine Alexa tabanlı bir fatura ödeme servisi sunuyor. Toronto merkezli Ecobee ise insanların sadece birkaç kelime söyleyerek oda sıcaklığını artırmalarına veya azaltmalarına olanak sağlayan Alexa uyumlu çok sayıda akıllı termostat üreticisinden biri. Bugün toplam satışlarının yaklaşık yüzde 40’ını, 10 yaşında olmasına rağmen en hızlı büyüyen ürün hattı Alexa tabanlı cihazlarından elde eden bir şirket olan Ecobee’nin CEO’su Stuart Lombard, “Bizim müşterilerimizin yaşamları koşturma içinde geçiyor” diyor ve ekliyor: “Onlar evlerine gitmek için trafikte boğuşmak ve sonra çocuklarını doyurmak, bebeklerinin altını değiştirmek ve kimbilir daha nelerle uğraşmak zorunda kalıyor. Biz onlara başka işlerle ilgilenirken bazı işleri ellerini kullanmadan yapma fırsatı sunuyoruz.” 

KONUŞMA AI İLE BULUŞTUĞUNDA

Ses ile çalışan AI’yi tüketiciler için bu kadar cazip kılan ise bizim bir klavye ile yazmamıza gerek kalmadan kendi konuşma ve düşünme tarzımıza cevap vererek bize sunduğu konfor... Bu, aynı zamanda teknik anlamda AI’yi daha da geliştirmeyi çok zorlaştırıyor. İnsanlar her zaman çok düzgün konuşmaz. Bazen kesik kesik konuşurlar. Hatta dilimiz dolanır. Kelimeler ağzımızdan uyuklayarak veya homurdanarak çıkar ve biz aslında öyle olmadığı halde mantıklı konuştuğumuzu zannederiz. Bazıları Seattle, Sunnyvale, California ve Cambridge, Massachusetts’deki araştırma merkezlerinde olmak üzere binlerce Amazon çalışanı bugün bu zorluğa çözüm bulmak için çalışıyor. Durum böyle olmasına rağmen Amazon’un iş ilanları sayfasında geçenlerde içinde 215 kişilik öğrenen makine uzmanlarının da olduğu düzinelerce bölüm için 1.100’den fazla Alexa bilimcisinin arandığı iş ilanı yayınlandı. Bu şirketin Cambridge bürosundaki bir toplantı esnasında ben Alexa’nın baş bilimcisi Rohit Prasad’a neden bu kadar çok insana ihtiyaç duyduğunu ve kendi araştırma ekibinin ne zaman tam anlamıyla kurulmuş olabileceğini düşündüğünü sordum. Prasa bana, “Sorduğun soru beni gülmekten öldürdü” diye cevap verdi. Gülmesi geçip kendisini toparladıktan birkaç saniye sonra Prasad konuşma teknolojisi üzerine 20 yıldan beri çalıştığını ve bu dönemin çoğunda sinir bozucu bir şekilde yavaş sonuç aldıklarını söyledi. Ancak son beş yılda devasa fırsatların önü açılmış. Buna rağmen sesle çalışan kusursuz bir AI yaratmak halen son derece karmaşık ve hiç tırmanılmamış bir zirve olarak duruyor. Geçmişte konuşma bilimcileri kaotik olabilecek telaffuzların tam olarak anlamlarını ilk denemede kavramakta zorlanmış olsalar da şimdi öğrenen makinelere yönelik yeni yaklaşımlarla farklı bir yol izleyerek ilerleme kaydediyorlar. Artık çabucak yaptıkları hassas ön tahminlerden sonra duydukları eksik kelimeleri düzeltip anlayabiliyorlar. Burada işin sırrı geniş kullanıcı verileri yığınları üzerinde çalışmakta ve önceki hatalardan dersler çıkarıp öğrenmekte yatıyor. Alexa kendi kullanıcılarıyla ne kadar fazla zaman geçirirse ve öğrenmek için ne kadar fazla veri toplarsa, o kadar daha zeki olacak. Bu alanda kat edilen ilerlemelerle ortaya daha fazla fırsat çıkacak ve insan gücüne daha çok gereksinim duyulacak. Prasad bana “Şimdi size bir örnek vereyim. Şayet Alexa’ya ‘Adele’in ilk albümü hangisiydi’ diye sorarsanız, cevap ‘19’ olacaktır. Eğer ardından ‘Peki şimdi onu çal’ dediğinizde Alexa o albümü çalması gerektiğini bilecektir” demişti. Peki ya konuşmanın ortasında araya başka bir konu girerse ne olur? Ya Alexa’ya önce bu albümün hangi yıl çıktığını ve kaç adet sattığını sorarsanız ne olur? Diyelim ki bu gizemli sohbetten sonra Alexa’ya “Onu çal” dediniz, o zaman Alexa’nın ilk sürümlerinin kafası karışırdı. Oysa bugün yeni teknoloji sayesinde her zaman olmasa bile Alexa “O”nun halen “19” anlamına geldiğini fark edebiliyor. 

~

ÖĞRENEN MAKİNE GELİŞMESİ

Bu ilerleme aslında Alexa’nın daha önce çuvalladığı binlerce sohbeti yeniden inceleyen öğrenen makine teknikleri sayesinde kaydedildi. Bu sistem kullanıcıların gerçekten neyi dinlemek istediklerini ve söz konusu müzik parçasının ilk defa sohbetin neresinde tanımlandığını bilebiliyor. MIT’de konuşma dili sistemleri başkanı olan James Glass, “Başlangıçta insanların ne isteyebileceği hakkında birtakım varsayımlar yapmanız gerekiyor. Sonrasında ise verileri bir araya getirir ve modelinize hassas ayar çekersiniz” diyor. Glass, bunun gibi bir öğrenen makine yaklaşımının yaygın bir şekilde kabul gördüğünü ancak bu yaklaşımı çalışır duruma getirmek için üniversitelerdeki araştırmacıların üzerinde çalışabileceklerinden çok daha fazla veriye gerek olduğunu söylüyor. Alexa kullanımının yaygınlaşmasıyla birlikte Amazon artık insan bilgisayar konuşma etkileşimlerinin geniş havuzuna daha fazla erişim imkanına sahip olarak Google’ın uzunca bir süredir keyfini sürdüğü metin bazlı arama sorgulamalarına karşı kendi ses teknolojisiyle sıkı bir rekabet avantajı sağlamış oluyor. Burada dışarıdan gelen veriler de çok yardımcı oluyor: Örneğin 2016 yılında Alexa’ya yüklenen şarkı sözleri sayesinde “drove my chevy to levee” sözlerini söyleyen bir kullanıcı anında Don McLean’in asıl adı “American Pie” olan şarkısına yönlendirilebiliyor. Prasad grubunun en son projelerinden biri de bu yaklaşımın esnekliğini gözler önüne seriyor. Burada kullanıcıların ilk isteklerine geri döndükleri anların şifreleri çözülüyor. Sinyal veren ifadeler muazzam değişiklik gösterebilir. Bazı insanlar “Hayır, hayır, hayır” diyebilirken, diğerleri “İptal et” demeyi veya üçüncü bir kesim de “Dur, aslında onu değil öncekini istiyorum” demeyi tercih edebilir. Alexa’nın burada her bir telaffuzu deşifre etmesi gerekmez. İçinde barındırdığı yığınla örnek ve kısmen denetlenen öğrenen makine tekniği sayesinde o olumsuz konuşmalara yönelik; muhtemel işaretlerden yola çıkarak konuşmanın akışı değiştikten sonra bile söylenenden mantıklı bir anlam çıkarabilir. Amazon’daki AI uzmanları Alexa’yı daha iyi bir dinleyici haline getirmenin yanı sıra sürekli kullanımını artırmak için bu makinenin sentetik kadın sesinin ritmine hassas ayar çekerek onun daha iyi bir konuşmacı olması amacıyla geniş bir anonim veri hazinesinden de faydalanıyor. Konuşma sentezine yönelik geleneksel çabalar, çok sayıda kaydedilmiş insan konuşmasının makaslanmış kırpıntılarını kaynaştırmaya bel bağlar. Her ne kadar bu teknik makul bir doğal ses üretebiliyor olsa da insan bir konuşmacının kullanabileceği türden fısıldamaları, ironileri veya diğer tarz kiplemeleri yapamaz. Amazon’un öğrenen makine algoritmaları Alexa’nın çok hızlı konuşmalardan son derece yavaş diyaloglara kadar her şeyi anlayabilmesi için profesyonel seslendiricilerin arzulu, endişeli ve bilinçli seslendirmeleriyle eğitilerek farklı bir yaklaşımı benimseyebilir. Bu sayede Amazon sesli kitap yayıncısı Audible’ı kendi mülkiyetine geçirebilir. 

HAKKINDA KONUŞULACAK ÇOK ŞEY VAR

Sesle kumanda edilebilen AI cihazlarının en ateşli kullanıcıları arasında cep telefonlarına veya tablet bilgisayarlarına klavyeden yazmakta zorlanan insanlar var. Engellilere ev içi hizmetler sunan Philadelphia’lı Inglis şirketinin CEO’su Gavin Kerr bugüne kadar sekiz eve Amazon Echo ve Dot cihazının kurulumunu yapmış. Pilot test aşamasının ardından Kerr benzer 300 eve daha kurulum yapmayı ümit ediyor. Kerr, “Ev sakinleri için bu inanılmaz bir nimet. Bu sayede çok daha konforlu bir hayat sürebiliyorlar. En önemlisi hiç kimseye muhtaç olmuyorlar” diyor. Kerr, çoklu doku sertleşmesi veya diğer türden elden ayaktan düşüren hastalıklardan muzdarip yüzlerce insanla birlikte çalışıyor. Yatalak veya tekerlekli iskemleye mahkum insanlar için ulaşılması zor termostata erişmek kalıcı bir ızdırap kaynağı olabiliyor. Kerr, “Bu kişiler vücutlarına uygun sıcaklığı ayarlamakta zorlanıyor. 21 Santigrad derece sıcaklığında bir oda onlara bir saat sıcak başka bir saat soğuk gelebiliyor” diyor. Sınırlı hareket imkanlarıyla özellikle de gece gündüz yardım olmaksızın konforlu yaşamanın kolay bir yolu yok. Alexa’nın yazılımı bir parça düzeltmeyle feci konuşma özürlü olanlara bile hizmet edebilir hale getirilebilir. Kerr, 30’lu yaşların sonunda olan ve uzun süreli bir bakım tesisini terk ederek günlük yaşantısına geri dönmek isteyen bir adamdam bahsediyor. Kerr bu adamın “Alexa’nın komutlarını artık kullanamayacağım” dediğini hatırlıyor. “Biz de ona ‘Peki neleri söyleyebilirsin?’ diye sorduk. Ve ardından yazılım üzerinde tekrar çalışarak Alexa’nın onun kendi kelimeleriyle çalışabilir hale gelmesini sağladık. Şimdi o mutfağın ışığını açmak istediğinde ‘Mom’ diyor ve banyonun ışığının açılmasını istediğinde de ‘John’ diyor.” Her ne kadar Inglis kendi Echo kullanıcılarına dört saatlik bir eğitim veriyor olsa da, yeni kullanıcıların kendi yollarını el yordamıyla bulmalarına çok daha sık rastlanıyor. Zaten bir Echo’yu kutusundan çıkardığınızda ambalajının üstünde müzik çalma, alarmı kurma veya alışveriş listesini güncelleme gibi yaygın uygulamaların nasıl yapıldığını kolaylıkla görebiliyorsunuz. Bilinçli kullanıcılar ise ayarları değiştirmek, yeni uygulamalar aramak veya bir uygulamanın en iyi nasıl çalıştığına dair tavsiyeler almak için kendi akıllı telefonları ya da dizüstü bilgisayarlarından Alexa kontrol panellerini çalıştırabilir. Haziran ayında çok okunan bir internet günlüğünde Microsoft ürün müdürü Darren Austin, Alexa’nın müthiş başarısının günlük yaşamın yarattığı stresi hafifletme yeteneğinde yattığını yazmıştı. Austin, “Alexa basit bir söylem tarzıyla belirsizlikten ve unutma korkusundan kaynaklanan olumsuz duyguları hemen teskin ediyor” diye yazıyordu. Ayrıca kullanıcıların her türlü anlık şaşkınlıklarını ve arzularını Alexa’ya anlatma bağımlısı olduklarını da iddia ediyordu. Alexa genel müdürü Rob Pulciani her hafta, bazen daha da sık, Alexa ve Dot kullanıcılarının en sık görülen söylemleri hakkındaki birleştirilmiş verileri tarıyor. Genellikle listenin başında ağırlıklı olarak müzik, haberler, hava durumu, trafik ve oyunlar gibi konular oluyor. Ancak geçen ilkbaharda yeni bir konu hızla üst sıralara yükseldi. Bu ifade ise “Alexa, beni rahatlat”tı. Kullanıcılar bu talepte bulunduklarında teskin edici seslere doğru yönlendiriliyor. Kuş cıvıltıları, sahile vuran hafif dalgalar, gecenin içinde gürleyen yük trenleri. Kullanıcın tercih etmesi halinde bu gibi ortamsal ses döngüleri saatlerce çalmaya devam edebiliyor. Pulciani bu uygulamalar 2015 yılında ilk defa Alexa platformunda görüldüklerinde onları küçük garip özellikler olarak görmüştü. Ancak çok kısa bir sürede müthiş bir beğeni toplamışlardı. Stres içinde boğulup kalmış yetişkinler uykuya dalmak için bu seslerden faydalanıyor. Ebeveynler huysuz ve uyumayan bebekleri için onları ninni söyleyen dadılar gibi kullanıyor. Bu keşfinden sonra Pulciani ve meslektaşları birkaç hafta boyunca Alexa’nın iç mimarisini yeni Echo müşterilerinin yeni beceriler denemek istediklerinde ne türden sakinleştirici sesler duymak istediklerine cevap verecek şekilde ayarlamakla geçirdiler. 

SÜRDÜRÜLEBİLİR SOHBET 

Araştırmalarda Google, Apple, Microsoft ve Amazon’un AI platformlarının hepsinin de farklı güçlü yönleri olduğu göze çarpıyor. Geniş yelpazede arama komutlarında en iyisi Google Assistant. Apple’ın Siri’si ile Microsoft’un Cortana’sının ise başka yetenekleri var. Alexa özellikle alışveriş komutlarında çok iyi çalışıyor. Sesle kumanda edilen AI cihazların nihai zaferi ise kullanıcılarla gerçekçi ve uzun süreli sohbetler yapabilmesiyle mümkün olabilecek. Böylesi bir marifet için makinelerin becerisinde aşikar hiçbir talep olmasa bile konuşmacının niyetini sezebilecek devasa sıçramalar yaşanması gerekir. İnsanlar için “Haftalardır jimnastik salonuna gitmiyorum” diyen bir arkadaşının muhtemelen yaşadığı sıkıntılı anlar veya öz saygısıyla ilgili sorunlar hakkında konuşmak istediğini anlamak pek zor değildir. Ancak bir AI yazılımı için bunu kavramak hiç de kolay değildir. Konudan konuya atlamalar veya dolaylı kinayeler de AI için çözülmesi çok zor meselelerdir. AI’nin bir sonraki nesliyle bağlarını kuvvetlendirmek amacıyla Amazon bir yıl önce dünya genelinde bir düzine kadar üniversiteden mühendislik öğrencisini 20 dakikalık sohbet yapabilecek ses robotları yaratmaya davet etmişti. Önümüzdeki kasım ayına kadar en fazla ilerleme kaydeden üniversite 500 bin dolarlık ödülün sahibi olacak. Ben bir hafta sonu bu robotlardan yarım düzinesini basit sorgulamalardan başlayıp her türlü olası cevaba davet eden ucu açık tuzaklı ifadelerle sesli bir sınava tabi tuttum. Robotlardan biri bana “Son çıkan filmlerden hiç izlediğin oldu mu” diye sorduğunda ben “Evet. Hidden Figures’a gittim” diye yanıt vererek oldukça iyi bir başlangıç yaptım. NASA’nın ilk yıllarıyla ilgili bu dokunaklı film hakkında sıradan gazete yorumlarının aksine bu sosyal robot, “Bana göre Hidden Figures gerçek matematiğin yanında çok zayıf kalıyor” dedi. Bu filmden benim anladığım bu olmamasına rağmen bir AI programının bunu söylemesi bana büyüleyici bir tasvir gibi geldi. Sohbetimiz kısa bir süre sonra bitti. Ancak en azından bu kısa ama hoş anı yaşadık. Ne yazık ki diğer robotlardan hiç biriyle bu kadar bile yakınlaşamadık. En şaşkını ise ben internet siteleri hakkında konuştuğumuzu zannederken ağzından “Otomobile yemek servisi ister misiniz?” gibi cümleler çıkıvermişti. Bu robotların sınırlarıyla ilgili olarak belki biraz aşırı keskin söylemde bulunmuş olabilirim ancak onlara şunu da sormak gerek: “Siz karşılıklı anlaşma yapabilir misiniz?” Birkaç gün sonra Amazon’dan Prasad’a sosyal robotlar hakkında ne düşündüğünü sorduğumda bana ilk günlerde yaşanan hiçbir başarısızlığın kendisini rahatsız etmediğini söyledi. Bana, “Bu süper önemli bir alan. Burası Alexa’nın akıllı olabileceği bir yer. Ancak bu Go veya satranç gibi oyunları oynamaktan çok daha zor bir iş. Her ne kadar olası yığınla hamle olsa da bu oyunlarda nihai hedefin ne olduğunu bilirsiniz. Oysa bir sohbette karşınızdaki kişinin aslında neyi amaçladığını bile bilemezsiniz” dedi. Alexa işte bu soruna çözüm bulabilir hale geldiğinde biz onunla gerçekten konuşabiliyor olacağız.

Türkiye ve dünya ekonomisine yön veren gelişmeleri yorulmadan takip edebilmek için her yeni güne haber bültenimiz “Sabah Kahvesi” ile başlamak ister misiniz?


İLGİNİZİ ÇEKEBİLİR

Yorum Yaz