Giới thiệu
Một cách mới để nhập văn bản
koedesk không chỉ là công cụ phiên âm. Đây là sự thay đổi mô hình trong cách chúng ta cung cấp ngữ cảnh cho máy tính.
Bàn phím là khởi đầu, không phải kết thúc
Xuyên suốt lịch sử hiện đại, bàn phím là cách chính để chúng ta giao tiếp với máy móc. Chúng ta gõ lệnh, viết code, soạn tin nhắn. Nhưng khi AI trở thành đồng nghiệp thay vì chỉ là công cụ, lượng ngữ cảnh cần truyền đạt đã bùng nổ. Bàn phím không còn đủ nữa.
Công nghệ chuyển giọng nói thành văn bản đã đạt đến bước ngoặt. Nói giờ đây là phương thức nhập liệu khả thi — không phải thứ mới lạ mà là lựa chọn thay thế thực sự cho việc gõ phím. Đây là sự thay đổi mô hình trong cách con người tương tác với máy tính.
Giống như học gõ trên bàn phím QWERTY, nhập liệu bằng giọng nói cần luyện tập. Nhưng đường cong học tập ngắn hơn nhiều và lợi ích năng suất lớn hơn nhiều. Chúng tôi muốn cung cấp không chỉ một công cụ mà là trải nghiệm mới — thay đổi cách bạn nghĩ về nhập liệu.
Được xây dựng cho mọi ngôn ngữ, không chỉ tiếng Anh
Hầu hết các công cụ chuyển giọng nói thành văn bản được xây dựng tại Mỹ, tối ưu cho tiếng Anh. Chúng hoạt động đủ tốt cho người nói tiếng Anh, nhưng chất lượng giảm mạnh với các ngôn ngữ khác. Khi ngôn ngữ pha trộn — tiếng Nhật với thuật ngữ kỹ thuật tiếng Anh, tiếng Việt với đoạn code — các công cụ hiện có thường hỏng hoàn toàn.
Nhà phát triển chính của koedesk là người Nhật, làm việc từ Việt Nam. Trải nghiệm trực tiếp sử dụng nhập liệu giọng nói qua nhiều ngôn ngữ và giọng điệu đã định hình mọi quyết định thiết kế. Chúng tôi nhận ra điều người khác bỏ qua: khoảng cách độ chính xác giữa tiếng Anh và phần còn lại của thế giới.
Đó là lý do chúng tôi khuyên dùng ElevenLabs Scribe v2 làm mô hình mặc định. Nó mang lại độ chính xác cao ổn định trên mọi ngôn ngữ — không chỉ tiếng Anh và tiếng Nhật, mà cả tiếng Việt, Indonesia, Tây Ban Nha và hàng chục ngôn ngữ khác. koedesk hiện là một trong số ít ứng dụng desktop tích hợp Scribe v2.
Đơn giản theo thiết kế
koedesk cố tình đơn giản. Nhấn phím, nói, thả. Lời của bạn xuất hiện tại vị trí con trỏ. Không bước thừa, không cần cấu hình để bắt đầu.
Bên trong, chúng tôi rất chú trọng hiệu năng. Ứng dụng được xây dựng bằng Rust — ngôn ngữ dùng cho trình duyệt web và hệ điều hành. Phát hiện hoạt động giọng nói, thu âm và khởi tạo phiên âm đều được tối ưu cho độ trễ tối thiểu. Khi bạn ngừng nói, văn bản xuất hiện gần như ngay lập tức.
Hầu hết công cụ cạnh tranh dùng quy trình hai bước: mô hình chuyển giọng nói thành văn bản cho phiên âm thô, sau đó LLM nhẹ để loại bỏ từ đệm, sửa ngữ pháp và định dạng lại đầu ra. Chúng tôi có cách tiếp cận khác. Scribe v2 đủ chính xác nên không cần xử lý hậu kỳ LLM. Chúng tôi tin tưởng trực tiếp vào đầu ra của mô hình.
Đây là lựa chọn có chủ đích. Khi các mô hình chuyển giọng nói thành văn bản tiếp tục cải thiện, nhu cầu xử lý hậu kỳ LLM sẽ biến mất. Bằng cách giữ kiến trúc đơn giản, koedesk hưởng lợi trực tiếp từ mọi cải tiến của mô hình cơ sở — không có lớp phức tạp xen giữa.
Về Guide Inc.
Guide Inc. là công ty phát triển phần mềm có trụ sở tại Tokyo, Nhật Bản, với văn phòng phát triển tại Thành phố Hồ Chí Minh, Việt Nam. Thành lập năm 2021, chúng tôi chuyên về công nghệ tài chính — xây dựng nền tảng giao dịch và ứng dụng di động cho các tổ chức tài chính lớn của Nhật Bản.
koedesk ra đời từ công việc hàng ngày của chúng tôi. Là những nhà phát triển xây dựng hệ thống tài chính phức tạp, chúng tôi cần cách nhanh hơn để giao tiếp với trợ lý lập trình AI, viết tài liệu và soạn tin nhắn — mà không cần rời tay khỏi bàn phím. Chúng tôi đã tạo ra công cụ mà mình mong muốn, và quyết định chia sẻ với thế giới.
Cảm ơn bạn đã dùng thử koedesk.
Masaki Kondo
CEO, Guide Inc. Vietnam
Nhà phát triển chính, koedesk
Liên hệ
Thắc mắc chung: [email protected]