A Watson az IBM természetes nyelv-feldolgozó számítógépes rendszere. Ez biztosítja a híres kérdéseket megválaszoló szuperszámítógépet, valamint egy sor AI-alapú vállalati termékcsaládot, beleértve a Watson Speech to Text-t. A Watson Speech to Text áttekintésünkben áttekintjük az egyik legjobb beszéd-szöveg alkalmazást, amely ideális mindenki számára, aki audiót akar szöveggé alakítani.

A Watson beszédfeldolgozó platform elérhető az IBM Cloud webhelyen. Ez egy sokoldalú eszköz, és számos összefüggésben felhasználható, beleértve a diktálást és a konferenciahívás átiratát. Ráadásul, a legtöbb beszéd-szöveg alkalmazáshoz ellentétben, API-ként is elérhető, így a fejlesztők többek között beilleszthetik a hangvezérlő rendszerekbe..

Watson beszéd szöveghez: tervek és árképzés

A Watson Speech to Text használatával havonta akár 500 percnyi hangot is feldolgozhat ingyenesen. Ha ennél többet szeretne konvertálni, akkor fizetnie kell minden audio percért, és az arány a feldolgozott audio időtartama alapján változik. A költségek 0,01 és 0,02 dollár / perc között mozognak, és 0,03 dollár / perc pótdíjat számítanak fel, ha szüksége van az IBM egyedi nyelvi modelljére. Prémium alapú, csak idézettségű Watson tervek is elérhetők, amelyek hozzáférést biztosítanak a továbbfejlesztett adatvédelmi szolgáltatásokhoz és az üzemidő garanciáihoz.

A Watson beszéd-szöveges szolgáltatásának ára az átírni kívánt tartalom mennyiségétől függ. (Kép jóváírása: IBM)

A Watson Speech to Text rendszerhez általános célú IBM Cloud előfizetéssel is hozzáférhet. A természetes nyelv feldolgozása csak egy alkalmazás az AI szolgáltatások széles skáláján, amelyet az IBM Cloudon keresztül kaphat, tehát ez jó lehetőség minden olyan szervezet számára, amely hozzáférést igényel nagysebességű adatátvitelhez, csevegőbotokhoz vagy szöveg-beszéd eszközekhez.

Watson Speech to Text: Jellemzők

A rugalmas API-integrációnak és az IBM előzetesen felépített IBM eszközeinek köszönhetően a Watson beszédfelismerő szolgáltatás jóval meghaladja az alapvető átírást. Ha például ügyfélszolgálati környezetben szeretné használni, akkor a Watson Assistant beállítható a természetes nyelvi kérdések közvetlen feldolgozására vagy telefonon feltett kérdések megválaszolására..

Olvassa el  Optoma CinemaX P1 áttekintés

Watsonban az IBM összeállította a szolgáltatásban gazdag természetes nyelvfeldolgozó platformot. (Kép jóváírása: IBM)

A Watson élő nyelven működik 11 nyelven, és különféle előre felvett formátumokban képes hangot importálni. A streaming során a valós idejű diagnosztikai támogatás azt jelenti, hogy a Watson arra készteti a felhasználókat, hogy közelebb kerüljenek a mikrofonhoz vagy változtassanak meg a környezetükről. Ugyancsak lenyűgöző az a tény, hogy Watson megkülönbözteti a különféle hangszórókat a megosztott beszélgetésben a Hangszóró-dialízisnek köszönhetően – ez a szolgáltatás még mindig béta tesztelés alatt áll..

Watson Speech to Text: Beállítás

A Watson használatához először meg kell hoznia egy IBM Bluemix fiókot. A regisztráció ingyenes és fájdalommentes, csak e-mail címet és jelszót igényel. Miután bejelentkezett, hozzáadnia kell egy fiókjában egy rendelkezést a Beszéd a szöveghez szolgáltatáshoz. Ebben a szakaszban kap néhány hitelesítő adatot, amelyeket el kell mentenie a saját nyilvántartásába.

A Watson teljes szolgáltatáskészletéhez való hozzáféréshez regisztrálni kell az IBM Bluemix fiókra. (Kép jóváírása: IBM)

Miután ezt megtetted, a dolgok jelentősen összetettebbé válnak. A Watson eléréséhez hozzá kell adnia ezeket a hitelesítő adatokat egy ügyfél-egységes erőforrás-kereső (cURL) kódhoz, majd futtatnia kell a számítógépen. Pontosan megtudhatja, hogy melyik parancsot kell hívni, olvassa el ezt a praktikus útmutatót. Alternatív megoldásként, ha csak azt akarja látni, hogy a Watson rendszer mennyire jól működik anélkül, hogy át kellene ugrania az összes karikán, akkor kipróbálhatja az IBM demonstrációs webhelyén.

Watson beszéd a szöveghez: Interfész

A fogyasztóbarát hang-szöveges alkalmazásokkal ellentétben a Watson szolgáltatásait úgy tervezték, hogy hozzáférjenek API-k és más rendszerekbe ágyazott kódok révén. Ezért nincs igazi Watson “felület”. Ehelyett a Watson három különféle internetes protokollon keresztül érhető el. Ezek a WebSockets, a REST API és a Watson Developer Cloud.

A Watson Speech to Text a Watson Developer Cloud rendszeren keresztül kezelhető. (Kép jóváírása: IBM)

Olvassa el  A QuickBooks Pro 2020 áttekintése

A Watson ellenőrzéséhez parancssori eszközt kell használnia, amely a három út egyikén keresztül kapcsolódik az IBM felhőjéhez. Az a felületet, amelyet a Watsonnal kölcsönhatásba lépő végfelhasználó lát, a fejlesztői csapaton belül valakinek külön kell építenie.

Watson beszéd a szöveghez: Teljesítmény

Összességében lenyűgözött, hogy ez a természetes nyelv-feldolgozó platform valódi beszédet kezelt. Watson segítségével átírtuk a különféle kihívásokkal teli környezetben rögzített klipeket, valamint a híres beszédeket a Watson 11 támogatott nyelvén több nyelven is..

Megállapítottuk, hogy Watson jól teljesített az előre rögzített beszédgel. (Kép jóváírása: IBM)

Bár sok a háttérzajú klipek esetében a hibák gyakoribbak voltak, általában Watson hihetetlenül pontos eredményeket hozott. Teszteinkből úgy becsüljük, hogy a próbaverzión kívüli hibák átlagosan csak 150 szónál egyszer fordulnak elő. Világossá vált azonban, hogy a Watson Speaker Diarization funkciója miért marad a BETA tesztelésben, mivel az értékelés során többször egy hangot félrecímkézték különálló hangszórókként.

Watson beszéd a szöveghez: Támogatás

Az IBM erőforrásközpont rengeteg dokumentációt kínál annak érdekében, hogy jobban megértse, hogyan kell alkalmazni a Watson-t az adott felhasználási esetre. Érdemes kihasználni a Watson fejlesztői közösség által létrehozott és a GitHubba közzétett API-integrációkat és SDK-kat is..

A Watson API GitHub oldal jó támogatási forrást jelent a Watson Speech to Text szolgáltatáshoz. (Kép jóváírása: IBM)

Ha nem talál megoldást problémájára, akkor közvetlenül az IBM-hez fordulhat, ha megnyit egy támogatási jegyet, vagy telefonon felveszi velük a kapcsolatot. Mindaddig, amíg az egyik prémium Watson csomagot választotta, a Watson használatát Service Level Uptime megállapodás védi..

Watson beszéd a szöveghez: Végső ítélet

Ha a szervezet rendelkezik know-how-val és erőforrásokkal az IBM Watson Speech to Text platform megfelelő integrálásához a rendszerébe, akkor előnyeit élvezheti a fejlett funkciók, például a valós idejű hangkörnyezet-diagnosztika és az ideiglenes átírási eredmények. A kisvállalkozások és szervezetek azonban küzdenek a Watson megfelelő felállításának technikai kihívásaival.

Olvassa el  MyFico áttekintés

A verseny

Az IBM Watson Speech to Text szolgáltatás közvetlen versenytársa a tömeges transzkripciós szolgáltatásoknak, a Google Cloud Speech-to-Text és az Amazon Transcribe-nak. Mindkettő lényegesen olcsóbb, mint a Watson, például a Google Cloud transzkripcióval, amely percenként 0,006 dollárt indít. Mindhárom szolgáltatás hasonló funkciókkal rendelkezik, mint például a testreszabott szókincs, de az IBM Watson-tól hiányzik egy, de mindkét versenytársnál elérhető szolgáltatás, az automatikus írásjelek felismerése.

Másik megoldást keres a szóban forgó szöveges üzenethez? Nézze meg a legjobb beszéd-szöveges szoftver útmutatónkat.