Doporučující algoritmy Spotify: Kdo a jak určuje, co uslyšíte | robot_dreams Czech
should_authorize_via_email
email.input_code tel.input_code
 
email.code_actual_for tel.code_actual_for
apply_exit_text
session_ended
to_homepage
Doporučující algoritmy Spotify: Kdo a jak určuje, co uslyšíte

Doporučující algoritmy Spotify: Kdo a jak určuje, co uslyšíte

Převzato z Wall Street Journal

Spotify je známá svými personalizovanými seznamy skladeb, které jsou řazeny pomocí doporučujících algoritmů. Každý měsíc si skladby poslechne více než 500 milionů lidí - tato data jsou zdrojovým materiálem, na jehož základě lze vytvářet modely doporučujících algoritmů.

Wall Street Journal analyzoval, jak tato služba využívá umělou inteligenci a analýzu dat k personalizaci uživatelského zážitku. Podívej se na upravený článek:

Jak funguje základní filtrování a proč není dokonalé

Společnost Spotify vstoupila na scénu v roce 2008 a v roce 2014 koupila společnost The Echo Nest, která se zabývala analýzou hudby a kombinovala strojové učení a zpracování přirozeného jazyka, aby naplnila svou databázi skladeb a interpretů. Společnost Spotify uvádí, že tato technologie se stala důležitým krokem ve vývoji doporučujícího systému.

Systém začíná kolaborativním filtrováním, které umožňuje identifikovat vzory a zjistit, jak často se skladby v playlistu objevují vedle sebe. Lze to nazvat vytvářením mapy hudby a podcastů. Mapa by měla vypadat nějak takto (obrázek 1), ale ve skutečnosti má více rozměrů.

Obrázek 1 // Hudební a podcastová mapa Spotify // Zdroj: WSJ

Každá tečka představuje jinou skladbu v katalogu Spotify. Některé skladby se objevují vedle sebe, protože je uživatelé zařadili do playlistů nebo je poslouchali po sobě. Pokud se tedy dvě skladby často objevují ve stejném seznamu skladeb, budou umístěny blízko sebe.

Doporučení založená pouze na kolaborativním filtrování však nejsou dokonalá.

Například během svátků písně All I Want For Christmas Is You může být v seznamu vedle písní Silent Night, i když All I Want... zní jako popová píseň:

…а Silent Night — jako vánoční píseň:

Pokud by služba Spotify doporučovala pouze na základě blízkosti skladeb na mapě, uživatelům, kteří mají rádi Mariah Carey, by mohla být nabídnuta skladba Silent Night, i když se o vánoční písně nezajímají.

Další úroveň analýzy contentu

Aby tomu společnost Spotify zabránila, přidává další vrstvu analýzy nazvanou filtrování podle obsahu. Tento algoritmus shromažďuje metadata, jako je datum vydání a značka, a analyzuje nezpracovaný zvuk. K popisu zvukových charakteristik skladby používá metriky, jako je tanečnost a hlasitost.

Zde jsou výsledky pro píseň Uptown Funk - její hodnocení tanečnosti je 0,856 (na stupnici od 0 do 1) (Obrázek 2):

Obrázek 2 // Zdroj: WSJ

Algoritmus také analyzuje časovou strukturu každé stopy. Zde je vizuální znázornění pro píseň Anti-Hero od Taylor Swift, kde jsou zobrazeny takty, takty a noty (Obrázek 3):

Obrázek 3 // Zdroj: WSJ

Filtrování na základě obsahu zohledňuje také kulturní kontext. Za tímto účelem studujeme texty písní a analyzujeme přídavná jména používaná k popisu skladby v článcích a blozích.

Důležité: Tyto metody filtrování nejsou ve službě Spotify jedinečné. Platforma se od ostatních odlišuje množstvím uživatelských dat, která má k dispozici, a produkty, které na jejich základě vytváří.

Problémy s doporučeními Spotify

Muzikolog a výzkumník v oblasti umělé inteligence Thomas Hodgson říká, že nebezpečí algoritmů spočívá v tom, že mohou zesílit stávající chyby. Například určitý hudební katalog může obsahovat více umělců než interpretů. A když posluchači začnou s tímto katalogem komunikovat, takových chyb přibývá - a vzniká takzvaná smyčka zpětné vazby.

Algoritmus služby Spotify také není optimalizován pro nové umělce - právě kvůli nedostatku uživatelských dat. Tomu se říká problém cold start. Ziad Sultan, vedoucí personalizace společnosti Spotify, říká, že právě zde hrají důležitou roli při poskytování doporučení redaktoři:

"Jsou to pravděpodobně jedni z nejlepších lidí na světě, kteří se snaží porozumět novinkám, kultuře a tomu, co frčí."

Hodgson však upozorňuje, že největší obavy vzbuzuje skutečnost, že některé metriky používané pro analýzu zvuku mohou být ovlivněny kulturními předsudky. V různých částech světa se hudební systémy a hudební kultury velmi liší. Jako příklad uveďme severoindickou melodii:

Algoritmus Spotify definuje tóninu jako e moll, což podle Hodgsona není pro tuto hudební tradici vhodné. Hudba pocházející z jižní Asie je však srozumitelná algoritmům používajícím západní stupnici s oktávami rozdělenými do stejných intervalů.

Někteří odborníci z oboru také poukazují na problémy se způsobem, jakým systém chápe metadata klasické hudby - ta mohou obsahovat nejen název skladby a jméno interpreta, ale také tempo, číslo opusu a jméno dirigenta, ale algoritmus Spotify na to není optimalizován.

Mimochodem. Apple Music, která se v posledních letech stala konkurentem Spotify, vydala v březnu novou aplikaci Apple Music Classical, která má tento problém řešit.

Plány společnosti Spotify v oblasti umělé inteligence do budoucna

V únoru se Spotify dotklo nedávného rozruchu kolem generativní umělé inteligence. Vytvořilo virtuálního DJ, který dává algoritmu lidský hlas a nabízí posluchačům další kontext pro doporučení:

Sultan říká, že společnost také zkoumá technologii posilování učení, která umožní systému doporučení učit se automaticky na základě zpětné vazby. To pomůže zajistit rozmanitost doporučení a dlouhodobé udržení účastníků školení.

Autor:  Andriy Denysenko

Více článků