Shazam, Aradığınız Şarkıyı Saniyeler İçinde Nasıl Buluyor? Hem de Arkada Gürültü Olsa Bile!

Oturduğumuz bir kafede, katıldığımız etkinliklerde ya da en kolayından havalı görüntü edit’lerinde duyduğumuz şarkılar güzelimize gittiğinde telefonumuzu açıp Shazam’a giriyoruz ve Shazam da saniyeler içinde o şarkıyı bize verebiliyor. 

Bunu bilhassa de kafe ve aktiflik üzere art plan seslerinin ağır olduğu ortamlarda yapabilmesi ise durup; “nasıl saniyeler içinde şarkıyı buluyor” diye düşündürüyor. Elbette şarkıyı bulduktan sonra, sıradaki şarkıyı Shazam’lama gereksinimi duyana kadar uygulamanın yüzüne bakmadığımız için art planda dönenlere pek de dikkat etmiyoruz. Ama işin o kısmı daha etkileyici.

Öncelikle kısaca Shazam’dan bahsedelim.

2022’de ayda 225 milyonu aşkın kullanıcıya ulaşmış olan uygulamamız hayli kolay bir mantığa sahip. Uygulamayı açtığınızda yapmanız gereken tek şey büyük logoya bir kez dokunmak. Bunun akabinde Shazam, mikrofonunuzu kullanarak müziği dinliyor ve ne olduğunu adeta bir kara büyü üzere saniyeler içinde buluyor.

Tabii biz tekrar de Orta Çağ geleneklerinden uzaklaşıp Shazam’a kara büyü dememeyi tercih edelim. İşte ardındaki mantık:

Shazam’a müziği dinlettiğinizde uygulamada o müziğin ses dalgaları, bilgisayarın işleyebileceği datalara dönüşmüş oluyor. Bu sayede her müzik için eşsiz bir dalga oluştuğundan, bir parmak izi oluşturulmuş oluyor. Bu süreç bir basitleştirme temelinde ilerliyor. Sesin yükseldiği, inceldiği yahut kalınlaştığı yerleri tümüyle dahil etmek yerine bu olayların ses dalgalarındaki zirve noktaları dikkate alınıyor. Aslında sürecin saniyeler sürmesini sağlayan da bu kolaylık.

Temel mantığı anladıktan sonra pratik örneğe geçelim. Diyelim ki kafede otururken çalan müzik hoşunuza gitti ve şarkıyı Shazam’ladınız. Logo’ya bastığınız an Shazam, sesi kaydederek bir spektrogram oluşturuyor. Mikrofona gelen tüm seslerin makul bir vakit (Shazam için maks. 20 saniye) aralığında kaydedildiği bu spektogram’da daha sonradan, az evvel bahsettiğimiz zirve noktaları oluşturuluyor ve üstte gördüğünüz karmaşa kolaylaşmış oluyor.

Son evrede ise artık veriye dönüşmüş olan bu zirve noktaları, birbiriyle eşleştirilerek Shazam’ın devasa kütüphanesinde öbür bilgi çiftleriyle karşılaştırılıyor. Şayet gereğince çift eşleşirse de Shazam, şarkıyı bulduğunu söyleyerek şarkı ismini ve sanatçıyı verebiliyor. Elbette bu uzun uzun anlattığımız süreç, bilgisayar tarafından geliştirildiğinden saniyeler içinde bitebiliyor.

Bu açıdan baktığımızda Shazam algoritması, bizim nefes alıp vermemiz kadar kolay ve tıpkı halde ayrıntılı.

Kaynaklar: Toptal, Wall Street Journal

What do you think?

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

GIPHY App Key not set. Please check settings

Meksika’da sergilenen uzaylı mumyalarının şimdi de canlı ve yumurtalarla dolu olduğu iddia edildi

YouTube’a Yapay Zekâ Dopingi: Tavsiyeler Verip, Kısa Videolar Bile Oluşturabilecek!