TV'nizi daha iyi anlamaya çalışmak

Anonim

Waterloo Üniversitesi'ndeki yeni araştırmalar, ev eğlence platformlarının sesli sorgu anlama yeteneklerini geliştirmenin bir yolunu bulmuştur.

Araştırma, Maryland Üniversitesi ve Comcast Uygulamalı AI Araştırma Laboratuvarı işbirliği ile, bugüne kadar TV'lerle en doğal konuşma temelli etkileşimleri elde etmek için yapay zeka (AI) teknolojisini kullanmaktadır.

"Bugün, ihaleyi yapan akıllı ajanlarla konuşmaya alışmışız - Siri'den bir cep telefonundan evde Alexa'ya. Neden aynısını televizyonlarla yapamayız?" diye sordu Jimmy Lin, Waterloo Üniversitesi'nde profesör ve David R. Cheriton Bilgisayar Bilimi Okulu'nda David R. Cheriton Başkanı.

"Comcast'in Xfinity X1'i tam olarak bunu yapmayı amaçlıyor - platform, konuşulan soruları kabul eden bir" uzaktan kumanda "ile geliyor. Dileklerin buyruğu - TV'nizi kanal değiştirmek, ücretsiz çocuk filmleri hakkında sormak ve hatta hava durumu hakkında bilgi vermek tahmini."

Ses sorgularının anlaşılmasıyla ilgili karmaşık problemin üstesinden gelmek için araştırmacılar, içeriği daha iyi modellemek ve sistemin doğruluğunu geliştirmek için en son AI teknolojisinden (hiyerarşik tekrarlayan sinir ağları olarak bilinen bir teknik) faydalanma fikrini taşıyorlardı.

Ocak 2018'de, araştırmacıların yeni sinir ağı modeli, gerçek canlı kullanıcılardan gelen soruları yanıtlamak için üretime yerleştirildi. Sorguların yaklaşık% 8'inin karıştığı önceki sistemden farklı olarak, yeni model çok karmaşık sorguların çoğunu uygun şekilde yönetir ve kullanıcı deneyimini büyük ölçüde artırır.

“Bir izleyici, hem bir dram dizisine hem de bir futbol takımına atıfta bulunan 'Chicago Fire'ı sorarsa, sistem gerçekten ne istediğinizi deşifre edebilir” diyor Lin. "Bu yaklaşımla ilgili özel olan, sonuçların kişiselleştirilmesi ve böylece doğruluğun artırılması için daha önce izlenen şovlar ve favori kanallar gibi bağlamdan faydalanmamızdır."

Araştırmacılar daha da zengin bir model geliştirmek için çalışmaya başladı. Sezgi, sorguları çoklu bakış açılarıyla analiz ederek, izleyicinin söylediklerini daha iyi anlayabilmesidir.

Ses Sorguyu Anlama Eğlence Platformu için Sinir Ağları ile Çok Görevli Öğrenme, Birleşik Krallık'ta son zamanlarda düzenlenen 24. ACM SIGKDD Uluslararası Bilgi Keşfi ve Veri Madenciliği Konferansı'nda sunuldu. Araştırma Jin Pheng, Ph.D. Maryland Üniversitesi, danışmanı Lin ve akıl hocası Ferhan Ture, Comcast Uygulamalı AI Araştırma Laboratuarı'nda araştırmacı olarak çalıştı.

menu
menu