О нас
Новый способ ввода текста
koedesk — это не просто инструмент транскрибации. Это смена парадигмы в том, как мы передаём контекст компьютерам.
Клавиатура была началом, а не концом
На протяжении всей современной истории клавиатура была нашим основным способом общения с машинами. Мы набираем команды, пишем код, составляем сообщения. Но по мере того, как ИИ становится сотрудником, а не просто инструментом, объём контекста, который необходимо передать, вырос лавинообразно. Клавиатуры больше недостаточно.
Технология распознавания речи достигла переломного момента. Речь теперь является полноценным методом ввода — не новинкой, а настоящей альтернативой набору текста. Это смена парадигмы во взаимодействии человека с компьютером.
Как и обучение печати на клавиатуре QWERTY, голосовой ввод требует практики. Но кривая обучения значительно короче, а рост продуктивности значительно больше. Мы хотим предоставить не просто инструмент, а новый опыт — такой, который изменит ваше отношение к вводу данных.
Создан для каждого языка, а не только для английского
Большинство инструментов голос-в-текст созданы в США и оптимизированы для английского языка. Они достаточно хорошо работают для англоговорящих, но качество резко падает для других языков. Когда языки смешиваются — японский с английскими техническими терминами, вьетнамский с фрагментами кода — существующие инструменты часто полностью отказывают.
Ведущий разработчик koedesk — японец, работающий из Вьетнама. Этот личный опыт использования голосового ввода на разных языках и с разными акцентами сформировал каждое дизайнерское решение. Мы заметили то, что другие упустили: разрыв в точности между английским и остальным миром.
Поэтому мы рекомендуем ElevenLabs Scribe v2 в качестве модели по умолчанию. Она обеспечивает стабильно высокую точность на всех языках — не только английском и японском, но и вьетнамском, индонезийском, испанском и десятках других. koedesk в настоящее время является одним из немногих настольных приложений, предлагающих интеграцию со Scribe v2.
Простота заложена в дизайне
koedesk намеренно прост. Нажмите клавишу, говорите, отпустите. Ваши слова появляются там, где находится курсор. Никаких дополнительных шагов, никакой настройки для начала работы.
Под капотом мы одержимы производительностью. Приложение написано на Rust — том же языке, который используется для движков браузеров и операционных систем. Обнаружение голосовой активности, захват аудио и инициация транскрибации оптимизированы для минимальной задержки. Когда вы прекращаете говорить, текст появляется практически мгновенно.
Большинство конкурирующих инструментов используют двухэтапный конвейер: модель распознавания речи для сырой транскрипции, затем лёгкую LLM для удаления слов-паразитов, исправления грамматики и переформатирования результата. Мы используем другой подход. Scribe v2 достаточно точен, чтобы постобработка LLM была не нужна. Мы доверяем результату модели напрямую.
Это осознанный выбор. По мере улучшения моделей распознавания речи потребность в постобработке LLM исчезнет. Сохраняя простую архитектуру, koedesk напрямую выигрывает от каждого улучшения базовых моделей — без слоёв сложности между ними.
О Guide Inc.
Guide Inc. — компания по разработке программного обеспечения с штаб-квартирой в Токио, Япония, и офисом разработки в Хошимине, Вьетнам. Основана в 2021 году, специализируемся на финансовых технологиях — создаём торговые платформы и мобильные приложения для крупных японских финансовых учреждений.
koedesk родился из нашей повседневной работы. Как разработчики, создающие сложные финансовые системы, нам нужен был более быстрый способ общения с ИИ-помощниками по коду, написания документации и составления сообщений — не отрывая рук от клавиатуры. Мы создали инструмент, о котором мечтали, и решили поделиться им с миром.
Спасибо, что попробовали koedesk.
Masaki Kondo
CEO, Guide Inc. Vietnam
Ведущий разработчик, koedesk
Контакты
Общие вопросы: [email protected]