Rólunk
Egy új módja a szövegbevitelnek
A koedesk nem csupán egy átírási eszköz. Paradigmaváltás abban, ahogyan kontextust adunk a számítógépeknek.
A billentyűzet a kezdet volt, nem a vég
A modern történelem során a billentyűzet volt a fő kommunikációs eszközünk a gépekkel. Parancsokat gépelünk, kódot írunk, üzeneteket szerkesztünk. De ahogy a mesterséges intelligencia munkatárssá válik és nem csupán eszközzé, az átadandó kontextus mennyisége robbanásszerűen megnőtt. A billentyűzet már nem elég.
A beszédfelismerő technológia fordulóponthoz érkezett. A beszéd ma már életképes beviteli módszer — nem újdonság, hanem valódi alternatívája a gépelésnek. Ez paradigmaváltás az ember-számítógép interakcióban.
Ahogyan a QWERTY billentyűzeten való gépelés megtanulása, a hangbevitel is gyakorlást igényel. De a tanulási görbe sokkal rövidebb, és a termelékenységi nyereség sokkal nagyobb. Nem csupán egy eszközt szeretnénk nyújtani, hanem egy új élményt — olyat, amely megváltoztatja, hogyan gondolkodik a bevitelről.
Minden nyelvre tervezve, nem csak angolra
A legtöbb hang-szöveg eszközt az USA-ban fejlesztik, angolra optimalizálva. Elég jól működnek angol anyanyelvűek számára, de a minőség más nyelveknél meredeken csökken. Amikor a nyelvek keverednek — japán angol műszaki kifejezésekkel, vietnami kódrészletekkel — a meglévő eszközök gyakran teljesen csődöt mondanak.
A koedesk vezető fejlesztője japán, Vietnamból dolgozik. A hangbevitel különböző nyelveken és akcentusokkal való használatának közvetlen tapasztalata minden tervezési döntést formált. Észrevettük, amit mások figyelmen kívül hagytak: a pontossági szakadékot az angol és a világ többi része között.
Ezért ajánljuk az ElevenLabs Scribe v2-t alapértelmezett modellként. Konzisztensen magas pontosságot nyújt minden nyelven — nem csak angolul és japánul, hanem vietnamiul, indonézül, spanyolul és tucatnyi más nyelven is. A koedesk jelenleg az egyik kevés asztali alkalmazás, amely Scribe v2 integrációt kínál.
Szándékosan egyszerű
A koedesk szándékosan egyszerű. Nyomjon meg egy billentyűt, beszéljen, engedje el. Szavai ott jelennek meg, ahol a kurzor van. Nincsenek extra lépések, nincs szükség konfigurációra az induláshoz.
A motorháztető alatt megszállottan figyel a teljesítményre. Az alkalmazás Rust nyelven készült — ugyanazzal a nyelvvel, amelyet böngészőmotorokhoz és operációs rendszerekhez használnak. A hangaktivitás-észlelés, hangfelvétel és átírás-indítás mind minimális késleltetésre van hangolva. Amikor abbahagyja a beszédet, a szöveg szinte azonnal megjelenik.
A legtöbb versenyző eszköz kétlépcsős folyamatot használ: egy beszéd-szöveg modellt a nyers átíráshoz, majd egy könnyű LLM-et a töltelékszavak tisztításához, nyelvtan javításához és kimenet újraformázásához. Mi más megközelítést választunk. A Scribe v2 elég pontos ahhoz, hogy az LLM utófeldolgozás szükségtelen legyen. Közvetlenül megbízunk a modell kimenetében.
Ez tudatos választás. Ahogy a beszéd-szöveg modellek tovább fejlődnek, az LLM utófeldolgozás szükségessége eltűnik. Egyszerű architektúránk fenntartásával a koedesk közvetlenül profitál az alapmodellek minden fejlesztéséből — köztes bonyolultsági rétegek nélkül.
A Guide Inc.-ről
A Guide Inc. egy szoftverfejlesztő vállalat, amelynek központja Tokióban, Japánban van, fejlesztési irodával Ho Si Minh-városban, Vietnamban. 2021-ben alapítva, pénzügyi technológiára specializálódtunk — kereskedési platformokat és mobilalkalmazásokat építünk nagy japán pénzintézetek számára.
A koedesk a mindennapi munkánkból született. Összetett pénzügyi rendszereket építő fejlesztőként gyorsabb módszerre volt szükségünk az AI kódolási asszisztensekkel való kommunikációhoz, dokumentáció írásához és üzenetek szerkesztéséhez — anélkül, hogy levennénk kezünket a billentyűzetről. Megépítettük azt az eszközt, amelynek létezését kívántuk, és úgy döntöttünk, megosztjuk a világgal.
Köszönjük, hogy kipróbálja a koedeskot.
Masaki Kondo
CEO, Guide Inc. Vietnam
Vezető fejlesztő, koedesk
Kapcsolat
Általános megkeresések: [email protected]