Google Meet Uyarlanabilir Ses: Google Bu Özelliği Nasıl Geliştirdi
Güne sabahın erken saatlerinde kalktığım zaman sinirli uyandığımı fark ettim. Üzerinde anlamlandıramadığım bir sinir olduğunda hemen aklıma güne saat kaçta başladığım geliyor. Yıllar geçtikçe kendimi hala tanıma fırsatı bulduğum için şaşıyorum. Sonuçta 29 yıllık hayatımda hala kendimi tam olarak tanımamış olmam sizce de ilginç değil mi? Ya da yıllar geçtikçe insan değişiyor ve aslında ömrümüzün sonuna dek kendimizi keşfetme fırsatımız olacak. Bu sinir sinir harbi içerisinde olduğum zaman beni sakinleştiren ilk iki şeyden ilki kendime zaman ayırmak oluyor. Bi kahve yapmak, kahve içerken yanında çikolata yemek vb gibi durumlar beni sakinleştiriyor. İkinci olarak ise yazmak! Yazmak bana hep çok iyi gelen, beni sakinleştiren, düşünme fırsatı sunan ve hep gerçek duygularımı yansıttığım bir aktivite oldu. Kendimi kötü hissettiğimde hep yazarak atarım içimdekileri. Birde son iki yıldır beni en iyi sakinleştiren şey oğlumun gülüşü, oğlumun sarılışı, oğlumun şefkati ve oğluma dair her şey olmaya başladı. Kendime vakit ayırmanın bana iyi geleceğini düşünerek hemen internete girdim ve yeni bilgiler öğrenmek için araştırmalara başladım. Tamda ilgimi çeken o başlık ile karşılaştım. Google Meet uygulanabilir ses özelliğini geliştirmiş.
Meet’teki uyarlanabilir ses özelliği, birbirine yakın birden fazla dizüstü bilgisayarı birleşik bir ses sistemine dönüştürerek gerçek hayatta doğaçlama toplantı alanları oluşturmamıza olanak tanıyor. Aynı odadan, aynı anda, aynı toplantıya katılabiliyorum ve kulak tırmalayan cızırtılar toplantımı asla bölemiyor.
Bu yılki Cloud Next etkinliğinde, Google Meet ekibi yan yana dizilmiş birkaç dizüstü bilgisayarın bulunduğu bir demo odası kurdular. Sonrasında müşterileri odaya davet ettiler ve dizüstü bilgisayarların aynı toplantıya aynı anda katılması durumunda ne olacağını düşündüklerini tek tek sorarak araştırdılar.
Meet ürün müdürü Huib Kleinhout’un söylediğine göre, müşterilerden biri “Ah, binlerce can çekişen ruhun çığlıkları gibi olacak,” diyerek aynı çağrıya katılan iki yakındaki cihazdan kaynaklanan yankı ve ses geri bildirimine atıfta bulunduklarını biliyorum. Lakin denemeyi yaptığında bir sessizlik ile karşılaştı. Şaşkın bir ifadeyle, “Bu nasıl çalışıyor? Hangi donanıma ihtiyacım var?” diye sordu. Onlarda 200 dolarlık bir Chrebook alıp ona her cihazda çalışabileceğini gösterdiler.
Bu demo, Meet’teki uyarlanabilir ses özelliği için özenle tasarlandı. Bahsettim bu özellik, birbirine yakın birden fazla dizüstü bilgisayarı birleşik bir ses sistemine dönüştürerek sanal toplantılarda yıllardır rahatsızlık veren kulak tırmalayıcı cızırtıları ortadan anında kaldırıyor. Uyarlanabilir ses özelliği ile Gemini for Workspace eklentisi olan Google Workspace müşterilerine sunuluyor. 3 Aralık 2024’e kadar geçerli olan ücretsiz 60 günlük Gemini deneme sürümü ile bu özelliği gönül rahatlığı ile deneyebilirim.
Ekip, pandeminin eklentisi ile dünya video konferanslarına ve sonrasında hibrit çalışmaya geçtikten sonra uyarlanabilir ses üzerinde çalışmaya başlamış bulunmakta. Bahsettiğim o dönemde, tedarik zinciri sıkıntıları nedeni ile yeni toplantı odası donanımlarına erişmek oldukça zordu. Meet Ürün Müdürü Huib, “Ayrıca, birçok kuruluşun başlangıçta yeterli video konferans odası yoktu ya da özel toplantı odası ekipmanları için kaynakları yoktu,” diyor.
Ekipler, tek bir dizüstü bilgisayar etrafında toplanma zahmeti olmadan doğaçlama toplantı alanları oluşturabiliyor olması gerekiyordu. Lakin herkesin kendi cihazlarından toplantıya katılmasını sağlarken aynı zamanda “çığlıkları” susturmak, göründüğünden çok daha zor bir hal alıyordu.
Meet Yazılım Mühendisliği Müdürü Henrik Lundin, “Bir sinema salonunun ses düzenini düşünün. Etrafınızda birden fazla hoparlör var ve hepsi aynı ses kaynağına bağlı olduğundan, senkronize bir şekilde çalışarak güzel bir ses deneyimi sunuyor,” diyor. “Ancak, odada senkronize olmadan aynı sesi çalan birden fazla cihaz varsa, korkunç bir ses çıkar. Aynı sesi birden fazla kez duyuyorsunuz, büyük bir katedraldeymiş gibi. Aynı şekilde, bir odada birden fazla cihazdaki mikrofonlar sesi aynı anda alsa da, aynı saate bağlı değiller.” diye de ekliyor cümlelerine.
Elbette bir de yankı sorunu var. Video konferans araçlarını kullanırken bazen kendi sesimin yankısını duyduğumu fark ettim. Henrik, “Bunu her zaman yaşamamanızın nedeni, toplantıları çalıştıran cihazlarda yankı engelleyici olmasıdır,” diye beyan ediyor fikrini ve ekliyor “Bu, mikrofon sinyalindeki sesin hangisinin hoparlörlerden gelen ve hangisinin sizin sesiniz olduğunu ayırt etmeye çalışan bir sinyal işleme algoritmasıdır. Aynı odada birden fazla dizüstü bilgisayar varken bu çok daha zor hale gelir.”
Bu ses bulmacasını çözmek için ayarlanan ekip, aynı odada bir araya gelerek dizüstü bilgisayarlarının yan yana olduklarını algılamalarını sağlamaya çalıştıklarını biliyorum. İlk başta, insanları toplantı içinde belirli ön ayar gruplarına katılmalarını sağlayarak sağlam bir testler yaptılar. Henrik, “Bu açıkça hataya açıktı, ancak tüm dizüstü bilgisayarların mikrofonlarını ve hoparlörlerini senkronize etme deneyimini test etmemize yardımcı oldu,” diye beyan ediyor fikrini.
Daha sonra ultrasonu denediler. İnsan kulağı tarafından algılanamayan yüksek frekanslı sesler yayarak, dizüstü bilgisayarlar birbirlerine yakın olan diğer cihazları tanımlayabiliyor olduğunu gördüler. Ve bir grup olarak hareket etmeye başladılar. Bu durum, biz kullanıcıların cihazlarını manuel olarak yapılandırmalarına ya da bulunduğumuz odayı seçmemize gerek kalmadan işlev görmemizi sağladı. Henrik, “Ancak bu oldukça zordu çünkü ultrasonun her cihazda güvenilir bir şekilde çalışması ve doğru olması gerekiyordu; yan odadan gelen ses sızarsa, sizi aynı odada zannetmemeliydi,” diyor. Kurulan ekip, doğruluğu artırmak için yeni bir ultrason türü benimsedi ve frekans ile sesi optimize ederek ulaşılan mesafeyi bir hayli artırdı.
Google Meet, birden fazla dizüstü bilgisayarın aynı odada olduğunu tespit ettiği zaman, uyarlanabilir ses otomatik olarak etkinleşiyor ve tüm dizüstü bilgisayarların mikrofonları ile hoparlörlerini otomatik olarak senkronize ediyor. Mikrofonlar arasında, kim konuşuyorsa ona göre geçiş yaparak geri bildirim ve yankıyı kesinlikle engelliyor. Üstelik, Meet arka planda işleme yaparak ve bulut üzerinde bir gürültü giderici kullanarak ses kalitesini bir hayli artırıyor ve arka plan gürültüsünü diğer katılımcılara iletmeden önce olabildiğince filtreliyor.
Google genelinde her gün yapılan toplantılarda uyarlanabilir ses zaten hali hazırda kullanılıyor ve çoğu katılımcı bunu fark etmeden bu problem hallediliyor. Meet Etkileşim Tasarımı Lideri Ahmed Aly, “Bu, kullanıcıdan bilişsel yükü kaldıran teknolojilerden biri. Toplantıya katılmadan önce doğru kuruluma sahip olup olmadıklarını düşünmek zorunda kalmıyorlar,” diyor ve ekliyor “Arkasındaki mühendislik ne kadar karmaşık ve harika olursa olsun, son kullanıcı açısından, dizüstü bilgisayarlarını açıp toplantıya katıldıklarında, sadece çalışıyor.”
İleriye dönük olarak uzman ekip, özellikle konferans donanımı ya da toplantı odalarının mevcut olmadığı durumlarda, kullanıcıların daha kolay bağlantı kurmalarına nasıl yardımcı olabileceklerini araştırmaya hızla devam ediyor. Huib, “Daha fazla esneklik sağlamasını ve toplantılarda eşitlik ile katılımı artırmasını umuyoruz,” diyor ve cümlelerine şu şekilde devam ediyor “Etkili olabilir ve tam anlamıyla temsil edilebilirsiniz lakin kamera ve mikrofon tam önünüzde olduğundan, nerede oturuyor olursanız olun tamamen görülüp duyulabilirsiniz.”
İşte bu haberi okumak beni rahatlatmış ve sakinleştirmişti. Artık kendime bir iyilik yaparak güzel bir kahve demledim. Yanında da o çok sevdiğim çikolatadan birkaç dilimin zararı olmaz diyerek kapadım gözlerimi ve sakinleşmenin tadını çıkararak muhteşem günüme kaldığım yerden devam ettim.