Hogyan működnek a macskabeszéd fordító alkalmazások?

Hogyan működnek a macskabeszéd fordító alkalmazások?

Valószínűleg láttál olyan alkalmazásokat, amelyek azt állítják, hogy lefordítják a macskád mondanivalóját. De tényleg le tudják fordítani a macskád nyávogását angolra? A rövid válasz igen, valahogy. Nehéz, mert minden macska 'nyelve' egyedi, de a modern technológiával nagyon közel tudnak kerülni.





Az olyan macskafordító alkalmazások, mint a MeowTalk, olyan beszédfelismerési formát használnak, amely hangsúlyozza a gépi tanulást. Nézzünk közelebbről.





Beszédfelismerés és gépi tanulás

Mary Theresa McLean/ Pixabay





A beszédfelismerés úgy működik, hogy beszédet rögzít, és a hangot digitális adatfájlmá alakítja. Az adatokat, például a hangmagasságot és a hangerőt olyan adatpontokként kódolja, amelyeket az alkalmazás elemezhet, és egyezhet a jelentésekkel. DPA mikrofonok elmagyarázza, hogy ezek az adatpontok nagyon eltérőek lehetnek a háttérhangoktól és a szó kimondásától függően.

Néha természetesnek vesszük a hangfelismerést, de ez hihetetlen technikai teljesítmény. Különösen, ha figyelembe vesszük, hogy mennyire összetett az emberi beszéd. Mint A tudós elmagyarázza, hogy minden szó hangok vagy „fonémák” széles skáláját foglalja magában. Nagyon nehéz rávenni a számítógépet a beszéd megértésére. A macskahangok új határa még nehezebb lesz.



A beszédfelismerést használó alkalmazások a szavak „szókincsével” vannak programozva, amelyet adathalmaznak neveznek. Az alkalmazás ezután a beszédét a szókincs legközelebbi opciójához illeszti.

Ha hibázik, kijavítja, és elmenti ezeket az adatokat a következő alkalommal. Ez a gépi tanulás része. Így a program megtanulja felismerni a beszédet akkor is, ha nem azonos azzal az adatkészlettel, amellyel kezdte.





Kapcsolódó: Mik azok a gépi tanulási algoritmusok? Így működnek

A hangfelismerésnek még mindig vannak problémái, különösen a beszédhibákkal és ékezetekkel. Néhány vállalat azonban javítja a gépi tanulást, hogy megoldja ezeket a problémákat. A gépi tanulás idővel hatékony eszközré alakíthatja a beszédfelismerést.





hogyan kell regisztrálni a készpénzes alkalmazásra

Így működik a beszédfelismerés az embereknél. De vajon működik -e a macskáknál?

Beszédfelismerés kontra Miau felismerés

Ariana Suarez / Splash visszavonása

Először is meg kell értenünk, hogy egy bizonyos típusú nyávogás „éhes vagyok” fordítása miért különbözik az emberi beszéd elemzésétől. A probléma leginkább az, hogy a macskakommunikáció nagyobb mértékben támaszkodik olyan nonverbális jelekre, mint a testtartás. Egy másik probléma az univerzális „macska nyelv” hiánya.

Szerint a ASPCA , felnőtt vadmacskák soha nem nyávognak egymásra, csak emberekre. Egyéb kutatások a Humán Társaság hozzáteszi, hogy ezek a hangok „nem vákuumban fordulnak elő”. Ezeket a testbeszéd és más összefüggések mellett kell értelmeznünk. Sok esetben ezek a néma jelek jelentik az egyetlen különbséget az „éhes vagyok” és a „játszani akarok” között.

Ha ezt a problémát hozzátesszük, nincs két egyforma nyelvű macska. A macskák személyre szabott „nyelveket” fejlesztenek ki gazdáik számára. Ezek részben a tulajdonos hangjának utánzásán, részben a macska személyiségén alapulnak. Nincs két egyforma macska, még akkor sem, ha ugyanazt a vágyat vagy igényt közvetíti. Tehát hogyan lehet lefordítani egy alkalmazás beszédkincsét mindannyiuk számára?

Rugalmas gépi tanulás macskák számára

Szabadon használható hangok/ Splash visszavonása

Bár néhány virtuális asszisztens szereti Automatikus Ha megpróbáljuk megérteni a hangot és az érzelmeket, a beszédfelismerés még mindig szörnyű a nonverbális jeleknél. De ez nem jelenti azt, hogy lehetetlen értelmezni őket.

hogyan lehet kikapcsolni az elbeszélőt az xbox one -on

A MeowTalk rugalmasabb gépi tanulást használ ezeknek a problémáknak a leküzdésére.

Letöltés: MeowTalk for Android | ios (Ingyenes)

A Meowtalkot Javier Sanchez készítette, aki az Alexa csapatában is dolgozott. Úgy képzelte az alkalmazást, mint egy lépést az intelligens nyakörvek felé. Ezek a nyakörvek a macskahangokat emberi beszédre fordítanák, összetett gépi tanulási stratégiákra támaszkodva, hogy segítsenek az embereknek jobban megérteni és gondozni a macskáikat.

A MeowTalk csapata kompenzálta az egyediség problémáit azzal, hogy minden macska számára specifikusabb profilokat készített. Az alkalmazásban minden macskát külön regisztrál. Tudomány Norvégia beszámol arról, hogy a cicák másképp nyávognak, mint a felnőtt macskák, ezért az alkalmazás a macska születésnapját is kéri. Minden profil egyedi adathálózatot hoz létre a macska számára, és egy kis mély tanulást is beépít a gépi tanulásba.

Kapcsolódó: Mély tanulás vs. gépi tanulás vs AI: Hogyan járnak együtt?

A szókincs esetében a MeowTalk 10 hangprofillal kezdődik az adatkészletében. Mindegyiknek más jelentése van, például „boldog” vagy „vadászat”. Ha az alkalmazás hangot hall, és rosszul értelmezi, javíthatja azt, vagy új értelmezést hozhat létre.

CATSOUNDS adatok innen gyűjtöttek Akvelon

A javítás azt mondja az alkalmazásnak, hogy cserélje le az alapszókincset az új hanggal.

hogyan lehet megtekinteni a grafikus kártya windows 10 -et

Például elmondhatja az alkalmazásnak, hogy a „Vadászat” funkciót rövid csicsergéshez illessze, nem pedig hosszú pityergést. Ez a fajta korrekció hasznosabb, mint több hang hozzáadása, amelyek egyeznek a beszédfelismerés módjával, ami olyan, mintha azt mondaná az alkalmazásnak, hogy hosszú jajgatás és rövid csipogás mindkét jelentése: „Anya hívás”.

A gépi tanulás a beszédfelismerő alkalmazásokban általában ellenáll az ilyen típusú felülírásoknak. Olyan lenne, mintha megpróbálnánk Siri -t megtanítani arra, hogy amikor azt mondod, hogy „technológiai blog”, akkor valóban „körtére” gondolsz. De a gépi tanulás rugalmasabb formája, amelyet a MeowTalk használ, könnyebben tudja kezelni ezt a korrekciót.

Egy új értelmezés létrehozása olyan jelentést ad hozzá, amelyet korábban nem kódoltak. Például, ha a macskája konkrét hívást kezdeményez, amikor a kedvenc játékszerét szeretné, akkor a „Szeretném az egeret” feliratot adhatja hozzá. Ez hasonlít ahhoz, hogy egy szót hozzáad az automatikus javítási szótárhoz.

Összefüggő: Hogyan határozzuk meg saját automatikus javítási szavainkat Androidon

Idővel nagyon személyre szabott beszédprofilt alakíthat ki macskájának. Végül akár elég kifinomult is lehet, hogy hasznos legyen a háziállatok gondozói számára, vagy viselkedésbeli problémák megoldására. Ha más nem is, segít a macskatulajdonosoknak, hogy figyelmesebbek legyenek kedvenceikre.

Az ítélet: működnek a macskafordító alkalmazások?

Végül a „macskafordítás” továbbra is sokat függ attól, hogy a felhasználó megtanítja -e az alkalmazást, hogyan beszél a macskája. Ez valószínűleg mindig így lesz, mivel minden macska kommunikációja egyedi.

De hihetetlen, hogy a gépi tanulás olyan messzire jutott, hogy a fejlesztők akár részben sikerrel járhatnak. A gépi tanulás és az AI rohamtempóban halad előre, és alig várjuk, hogy lássuk, merre tovább.

Részvény Részvény Csipog Email Kapcsolódó témák
  • Technológia magyarázata
  • Nyelvtanulás
  • Gépi tanulás
A szerzőről Natalie Stewart(47 cikk megjelent)

Natalie Stewart a MakeUseOf írója. Először az egyetemen kezdett érdeklődni a technológia iránt, és az egyetemen rajongott a médiaírás iránt. Natalie a hozzáférhető és könnyen használható technológiára összpontosít, és szereti azokat az alkalmazásokat és eszközöket, amelyek egyszerűbbé teszik a mindennapi emberek életét.

Bővebben: Natalie Stewart

Iratkozzon fel hírlevelünkre

Csatlakozz hírlevelünkhöz, ahol technikai tippeket, értékeléseket, ingyenes e -könyveket és exkluzív ajánlatokat találsz!

Feliratkozáshoz kattintson ide