Про нас
Новий спосіб введення тексту
koedesk — це не просто інструмент для транскрибації. Це зміна парадигми в тому, як ми надаємо контекст комп'ютерам.
Клавіатура була початком, а не кінцем
Протягом усієї сучасної історії клавіатура була нашим основним способом спілкування з машинами. Ми набираємо команди, пишемо код, складаємо повідомлення. Але з тим, як ШІ стає співробітником, а не лише інструментом, обсяг контексту, який потрібно передати, вибухово зріс. Клавіатури більше недостатньо.
Технологія розпізнавання мовлення досягла переломного моменту. Говоріння тепер є повноцінним методом введення — не новинкою, а справжньою альтернативою друкуванню. Це зміна парадигми у взаємодії людини з комп'ютером.
Як і навчання друкувати на клавіатурі QWERTY, голосове введення потребує практики. Але крива навчання значно коротша, а зростання продуктивності значно більше. Ми хочемо надати не просто інструмент, а новий досвід — такий, що змінить ваше ставлення до введення даних.
Створено для кожної мови, не лише для англійської
Більшість інструментів голос-у-текст створені в США та оптимізовані для англійської мови. Вони досить добре працюють для англомовних, але якість різко падає для інших мов. Коли мови змішуються — японська з англійськими технічними термінами, в'єтнамська з фрагментами коду — існуючі інструменти часто повністю відмовляють.
Головний розробник koedesk — японець, який працює з В'єтнаму. Цей особистий досвід використання голосового введення різними мовами та з різними акцентами сформував кожне дизайнерське рішення. Ми помітили те, що інші пропустили: розрив у точності між англійською та рештою світу.
Тому ми рекомендуємо ElevenLabs Scribe v2 як модель за замовчуванням. Вона забезпечує стабільно високу точність усіма мовами — не лише англійською та японською, а й в'єтнамською, індонезійською, іспанською та десятками інших. koedesk наразі є одним з небагатьох настільних додатків, що пропонують інтеграцію зі Scribe v2.
Простота за задумом
koedesk навмисно простий. Натисніть клавішу, говоріть, відпустіть. Ваші слова з'являються там, де знаходиться курсор. Жодних додаткових кроків, жодного налаштування для початку роботи.
Під капотом ми одержимі продуктивністю. Додаток написано на Rust — тій самій мові, що використовується для рушіїв браузерів та операційних систем. Виявлення голосової активності, захоплення аудіо та ініціація транскрибації оптимізовані для мінімальної затримки. Коли ви припиняєте говорити, текст з'являється майже миттєво.
Більшість конкуруючих інструментів використовують двоетапний конвеєр: модель розпізнавання мовлення для сирої транскрипції, потім легку LLM для видалення слів-паразитів, виправлення граматики та переформатування результату. Ми використовуємо інший підхід. Scribe v2 достатньо точний, щоб постобробка LLM була непотрібною. Ми довіряємо результату моделі напряму.
Це свідомий вибір. З покращенням моделей розпізнавання мовлення потреба в постобробці LLM зникне. Зберігаючи просту архітектуру, koedesk безпосередньо виграє від кожного покращення базових моделей — без шарів складності між ними.
Про Guide Inc.
Guide Inc. — компанія з розробки програмного забезпечення зі штаб-квартирою в Токіо, Японія, та офісом розробки в Хошиміні, В'єтнам. Заснована у 2021 році, спеціалізуємося на фінансових технологіях — створюємо торгові платформи та мобільні додатки для провідних японських фінансових установ.
koedesk народився з нашої повсякденної роботи. Як розробники, що створюють складні фінансові системи, нам потрібен був швидший спосіб спілкування з ШІ-помічниками з кодування, написання документації та складання повідомлень — не відриваючи рук від клавіатури. Ми створили інструмент, про який мріяли, і вирішили поділитися ним зі світом.
Дякуємо, що спробували koedesk.
Masaki Kondo
CEO, Guide Inc. Vietnam
Головний розробник, koedesk
Контакти
Загальні питання: [email protected]