ನೀವು ಧ್ವನಿ ಇನ್ಪುಟ್ ಬಳಸುತ್ತಿದ್ದೀರಾ? — ಕೀಬೋರ್ಡ್ನ ನಂತರದ "ಮುಂದಿನ" ಇನ್ಪುಟ್ ಇಂಟರ್ಫೇಸ್ ಬಗ್ಗೆ
ಪ್ರಸ್ತಾವನೆ — ಇನ್ಪುಟ್ ಇಂಟರ್ಫೇಸ್ ಬಗ್ಗೆ “ಆಸಕ್ತಿ”
ನೀವು ಧ್ವನಿ ಇನ್ಪುಟ್ ಬಳಸುತ್ತಿದ್ದೀರಾ?
ಇಂದು AI ಯ ಪ್ಯಾರಡೈಮ್ ತೀವ್ರ ವೇಗದಲ್ಲಿ ಬದಲಾಗುತ್ತಿರುವ ಸಮಯದಲ್ಲಿ, AI ಗೆ ಸಲ್ಲಿಸುವ ಇನ್ಪುಟ್ ಬದಿಯಲ್ಲಿ — ಎಲ್ಲಾ ಬಗೆಯ ಇನ್ಪುಟ್ ಇಂಟರ್ಫೇಸ್ಗಳಲ್ಲಿ — Speech-to-Text (ಧ್ವನಿಯನ್ನು ಪಠ್ಯವಾಗಿ ಪರಿವರ್ತಿಸುವುದು) ಎಂಬ ಹೊಸ ಮಾರ್ಗವು ಪ್ರಾಯೋಗಿಕವಾಗಿ ಬಳಸಬಹುದಾದ ಹಂತಕ್ಕೆ ತಲುಪಿದೆ. ಇಲ್ಲಿ ಒಂದು ದೊಡ್ಡ ತಿರುವು ಇದೆ ಎಂಬುದು ನನ್ನ ಭಾವನೆ.
ಎಂಜಿನಿಯರ್ಗಳಲ್ಲಿ PFU ಯ Happy Hacking Keyboard ಸಹಿತ ಎರಡು ಮೂರು ನೂರು ಡಾಲರ್ಗಳ ಬೆಲೆಯ ಕೀಬೋರ್ಡ್ಗಳನ್ನು ಬಳಸುವವರು ಸಾಕಷ್ಟು ಮಂದಿ ಇದ್ದಾರೆ. ನಾನು ಕೂಡ ಅವರಲ್ಲೊಬ್ಬ, ಒಂದು ಕಾಲದಲ್ಲಿ ಕೀಬೋರ್ಡ್ಗಳ ಬಗ್ಗೆ ತುಂಬಾ ಆಸಕ್ತನಾಗಿದ್ದೆ. ಇತ್ತೀಚೆಗೆ ಸ್ವತಃ ಜೋಡಿಸಿದ ಕೀಬೋರ್ಡ್ಗಳ ಸಮ್ಮೇಳನಗಳೂ ಕಳೆಗಟ್ಟುತ್ತಿವೆ.
ಕೀಬೋರ್ಡ್ ಎಂಬ ಇನ್ಪುಟ್ ಇಂಟರ್ಫೇಸ್ನ ಬಗ್ಗೆ ನಾವು ಇಷ್ಟು ಆಸಕ್ತಿ ತೋರಿಸುತ್ತಿರುವಾಗ, ಧ್ವನಿ ಇನ್ಪುಟ್ ಎಂಬ ಹೊಸ ಇನ್ಪುಟ್ ಇಂಟರ್ಫೇಸ್ನ ಬಗ್ಗೆಯೂ ಅದೇ ರೀತಿ ಆಸಕ್ತಿ ತೋರಿಸಬಾರದೇಕೆ? ಇಂತಹ ಆಲೋಚನೆಯಿಂದಲೇ ಈ ಲೇಖನವನ್ನು ಬರೆಯುತ್ತಿದ್ದೇನೆ.
ನನ್ನ ಬಗ್ಗೆ ಸ್ವಲ್ಪ
ನನ್ನ ಹೆಸರು Masaki Kondo. ನಾನು ವಿಯೆಟ್ನಾಮ್ನಲ್ಲಿರುವ ಒಂದು IT ಸಂಸ್ಥೆ Guide Inc. Vietnam ನ CEO ಆಗಿದ್ದೇನೆ. ಪ್ರತಿದಿನವೂ ಸಿಸ್ಟಮ್ ಅಭಿವೃದ್ಧಿಯಲ್ಲಿ ತೊಡಗಿಕೊಂಡಿರುತ್ತೇನೆ, ಮತ್ತು ಇತ್ತೀಚೆಗೆ Claude Code ಅನ್ನು ನನ್ನ ಕೆಲಸದ ಕೇಂದ್ರಸ್ಥಾನದಲ್ಲಿ ಇರಿಸಿಕೊಂಡು ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದೇನೆ.
ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳುವುದಾದರೆ, kondo-daily-ops ಎಂಬ ಪ್ರೈವೇಟ್ ರೆಪಾಸಿಟರಿಯನ್ನು ತಯಾರಿಸಿ, Backlog ನಲ್ಲಿ ಗ್ರಾಹಕರೊಂದಿಗಿನ ಸಂವಹನ, ಸಂಸ್ಥೆಯ ಸದಸ್ಯರೊಂದಿಗಿನ ಸಂವಹನ, ಕೆಲಸದ ಲಾಗ್ ನಿರ್ವಹಣೆ — ಬಹುಮಟ್ಟಿಗೆ ಎಲ್ಲವನ್ನೂ Claude Code ನ ಸಹಾಯದಿಂದ ಮಾಡುತ್ತಿದ್ದೇನೆ. ಟಿಕೆಟ್ನ ಹಿನ್ನೆಲೆಯನ್ನು API ಮೂಲಕ ಪಡೆಯುವುದು, ಹಿಂದಿನ ಲಾಗ್ಗಳಿಂದ ಸಂದರ್ಭವನ್ನು ಎತ್ತಿಕೊಳ್ಳುವುದು, ಸ್ಕಿಲ್ಗೆ ಪರಿವರ್ತಿಸಿದ ಪ್ರಕ್ರಿಯೆಯಿಂದ ಉತ್ತರ ತಯಾರಿಸುವುದು… ಇಂತಹ ಆಜ್ಞೆಗಳನ್ನು ಪ್ರತಿದಿನವೂ ನೀಡುತ್ತಿರುತ್ತೇನೆ.
ನೀವು ಊಹಿಸಿರಬಹುದು — ಈ ಆಜ್ಞೆಗಳು ಸ್ವಾಭಾವಿಕ ಭಾಷೆಯಲ್ಲಿರುತ್ತವೆ ಮತ್ತು ಸಾಕಷ್ಟು ಉದ್ದದ ವಾಕ್ಯಗಳಾಗಿರುತ್ತವೆ. ಇದನ್ನು ಕೀಬೋರ್ಡ್ನಿಂದ ಟೈಪ್ ಮಾಡುವುದು ನಿಜವಾಗಿಯೂ ಕಷ್ಟ.
AquaVoice ನ ಭೇಟಿ
2025 ರ ಕೊನೆಯ ಭಾಗದಲ್ಲಿ, AquaVoice ಎಂಬ ಧ್ವನಿ ಇನ್ಪುಟ್ ಆ್ಯಪ್ ಬಳಸಲು ಪ್ರಾರಂಭಿಸಿದೆ.
Claude Code ಗೆ ಉದ್ದದ ಆಜ್ಞೆಗಳನ್ನು ಬರೀ ಮಾತಾಡಿಯೇ ನೀಡಬಹುದು. ಇದು ನಾನು ಊಹಿಸಿದ್ದಕ್ಕಿಂತಲೂ ಹೆಚ್ಚು ಸಹಜವಾಗಿತ್ತು, ಮತ್ತು ಬೇಗನೆ ಧ್ವನಿ ಇನ್ಪುಟ್ ಇಲ್ಲದೆ ಇರಲಾಗದಂತಾಯಿತು. “ಈ ಟಿಕೆಟ್ ನೋಡಿ, ಹಿಂದಿನ ಲಾಗ್ಗಳಿಂದ ಸಂದರ್ಭವನ್ನು ಎತ್ತಿಕೊಂಡು, ಈ ಸ್ಕಿಲ್ ಬಳಸಿ ಉತ್ತರ ತಯಾರಿಸಿ” — ಇಂತಹ ಆಜ್ಞೆಗಳನ್ನು ಬರೀ ಮಾತಾಡಿಯೇ ನೀಡುವ ಸಹಜತೆಯನ್ನು ಒಮ್ಮೆ ಅನುಭವಿಸಿದರೆ, ಇನ್ನು ಹಿಂದಿನ ಸ್ಥಿತಿಗೆ ಮರಳಲಾಗದು.
ನಾನು ಏಕೆ ಸ್ವತಃ ತಯಾರಿಸಲು ನಿರ್ಧರಿಸಿದೆ
ಪ್ರಾಮಾಣಿಕವಾಗಿ ಹೇಳುತ್ತೇನೆ. AquaVoice ಬಗ್ಗೆ ನನಗೆ ಯಾವುದೇ ಅಸಮಾಧಾನ ಇರಲಿಲ್ಲ, ಮತ್ತು ನಾನು ಅದರಿಂದ ತೃಪ್ತನಾಗಿದ್ದೆ.
ಹಾಗಾದರೆ ಏಕೆ ಸ್ವತಃ ತಯಾರಿಸಿದೆ? ಉತ್ತರ ಸರಳ — ಶುದ್ಧ ಬೌದ್ಧಿಕ ಕುತೂಹಲ.
ಮೊದಲನೆಯದಾಗಿ, Rust ನಲ್ಲಿ ಏನಾದರೂ ಆ್ಯಪ್ಲಿಕೇಶನ್ ತಯಾರಿಸಬೇಕು ಎಂಬ ಆಸೆ ನನಗೆ ಬಹಳ ದಿನಗಳಿಂದ ಇತ್ತು. ಈ ಮೊದಲೂ Guidebook (Rust ನಲ್ಲಿ ತಯಾರಿಸಿದ ಸ್ಟ್ಯಾಟಿಕ್ ಸೈಟ್ ಜೆನರೇಟರ್) ಅಥವಾ ಸಂಸ್ಥೆಯ ಆಂತರಿಕ VPN (Headscale) ಇಂತಹ ನಾನು ಕೆಲಸದಲ್ಲಿ ಬಳಸುವ ಸಾಧನಗಳನ್ನು ಸ್ವತಃ ತಯಾರಿಸಿಕೊಂಡ ಅನುಭವವಿದೆ. ತನ್ನ ಸಾಧನವನ್ನು ತಾನೇ ಮಸೆದು ತಯಾರಿಸಿಕೊಳ್ಳುವುದು — ಇದು ತುಂಬಾ ಆನಂದದಾಯಕ.
ಜೊತೆಗೆ, AquaVoice ನ ಆಂತರಿಕ ತಾಂತ್ರಿಕ ಯಂತ್ರೋಪಾಯದ ಬಗ್ಗೆಯೂ ಕುತೂಹಲವಿತ್ತು. Speech-to-Text ಮೂಲಕ ಪಠ್ಯವಾಗಿ ಪರಿವರ್ತಿಸಿ, ನಂತರ LLM ಬಳಸಿ ಸಂಸ್ಕರಿಸಿ ಸುಂದರಗೊಳಿಸುವುದು — ಈ ಬಹು-ಹಂತದ ಪೈಪ್ಲೈನ್ ಬಗೆಗಿನ ಕುತೂಹಲ.
ವಾಸ್ತವವಾಗಿ AquaVoice ಬಗ್ಗೆ ತಿಳಿಯುವ ಮೊದಲೇ, ChatGPT ಯ ಧ್ವನಿ ಇನ್ಪುಟ್ನ ಪಠ್ಯ ಪರಿವರ್ತನೆಯ ನಿಖರತೆ ನನ್ನನ್ನು ಆಶ್ಚರ್ಯಚಕಿತಗೊಳಿಸಿತ್ತು. Claude Code ಗೆ ಇನ್ಪುಟ್ ಕೊಡಲೆಂದೇ ChatGPT ಯ ಡೆಸ್ಕ್ಟಾಪ್ ಆ್ಯಪ್ನಲ್ಲಿ ಮಾತಾಡಿ, ಪರಿವರ್ತಿಸಿದ ಪಠ್ಯವನ್ನು ಕಾಪಿ ಮಾಡಿ Claude Code ಗೆ ಪೇಸ್ಟ್ ಮಾಡುತ್ತಿದ್ದೆ — ಇಂತಹ ವಿಚಿತ್ರ ಪ್ರಯೋಗಗಳನ್ನೂ ಮಾಡಿದ್ದೆ.
ಆಗ OpenAI ನ gpt-4o-mini-transcribe API ಆಗಿ ಲಭ್ಯವಾಯಿತು. “ಇದನ್ನು ಬಳಸಿ ನಾನೇ ತಯಾರಿಸಬಹುದಲ್ಲವೇ?” — ಇದು ನಿರ್ಣಾಯಕ ಪ್ರೇರಣೆಯಾಯಿತು.
Speech-to-Text ಮಾದರಿಗಳ ಯಾತ್ರೆ
koedesk ನ ಅಭಿವೃದ್ಧಿಯಲ್ಲಿ ನಾನು ಹಲವಾರು STT ಮಾದರಿಗಳನ್ನು ಪರೀಕ್ಷಿಸಿದೆ.
Groq Whisper Large v3 Turbo — ವೇಗವಾಗಿದೆ. ಆದರೆ ಸ್ವಲ್ಪ ಹ್ಯಾಲುಸಿನೇಷನ್ ಇದೆ.
OpenAI GPT-4o Transcribe — ನಿಖರತೆ ಚೆನ್ನಾಗಿದೆ, ಆದರೆ ಮೌನದ ಸಮಯದಲ್ಲಿನ ಹ್ಯಾಲುಸಿನೇಷನ್ ಗಮನ ಸೆಳೆಯುತ್ತದೆ. ಜಪಾನೀಸ್ ಮತ್ತು ಇಂಗ್ಲಿಷ್ನಲ್ಲಿ ಬಲಶಾಲಿ, ಆದರೆ ವಿಯೆಟ್ನಾಮೀಸ್ನಲ್ಲಿ ಇಂಗ್ಲಿಷ್ ಬೆರೆಸಿದ ತಕ್ಷಣ ಒಡೆದುಹೋಗುತ್ತದೆ. ನಾವು ವಿಯೆಟ್ನಾಮ್ನಲ್ಲಿ ಸಿಸ್ಟಮ್ ಅಭಿವೃದ್ಧಿ ಮಾಡುತ್ತಿರುವುದರಿಂದ, ಇದು ಗಂಭೀರ ಸಮಸ್ಯೆಯಾಗಿತ್ತು.
Mistral (Voxtral) — ಸ್ವಲ್ಪ ಕಡಿಮೆ.
Gemini — STT ಮತ್ತು ಸಂಸ್ಕರಣೆಯನ್ನು ಒಮ್ಮೆಗೇ ಮಾಡಲು ಪ್ರಯತ್ನಿಸಿದೆ. ಅದು ಎಷ್ಟು ಧೈರ್ಯವಾಗಿ ಸಾಮಾನ್ಯೀಕರಿಸಿತೆಂದರೆ, ನಾನು ಹೇಳದ ವಿಷಯಗಳನ್ನೂ ಹ್ಯಾಲುಸಿನೇಟ್ ಮಾಡಿತು. ಬೆದರಿಸಿಕೊಂಡ ಕುದುರೆಯಂತಿತ್ತು.
LLM ಸಂಸ್ಕರಣೆಯ ಕಷ್ಟ
STT ಮಾತ್ರ ಮಾಡಲಾಗದ ಭಾಗವನ್ನು ತುಂಬಲು, LLM ಮೂಲಕ ಸಂಸ್ಕರಣೆ (ಫಿಲರ್ ತೆಗೆಯುವುದು, ಶಬ್ದಕೋಶ ಅನ್ವಯ, ಪಠ್ಯ ಸಂಯೋಜನೆ) ಯನ್ನೂ ಪರಿಶೀಲಿಸಿದೆ. 6 ಮಾದರಿಗಳಲ್ಲಿ 20 ಪ್ಯಾಟರ್ನ್ಗಳ ಬೆಂಚ್ಮಾರ್ಕ್ ಮಾಡಿದ ಪರಿಣಾಮ, ಪ್ರತಿ ಮಾದರಿಗೂ ಸ್ಪಷ್ಟವಾದ “ವ್ಯಕ್ತಿತ್ವ” ಇದೆ ಎಂದು ತಿಳಿಯಿತು.
- OpenAI ಕುಟುಂಬ: ಸಂಪ್ರದಾಯವಾದಿ ಮತ್ತು ಎಚ್ಚರಿಕೆಯ. ಶಬ್ದಕೋಶವನ್ನು ಅನ್ವಯಿಸುತ್ತದೆ, ಆದರೆ ತಿಳಿಯದ ಪದಗಳಿಗೆ ಕೈ ಹಾಕುವುದಿಲ್ಲ. ಹ್ಯಾಲುಸಿನೇಷನ್ 0.
- Gemini ಕುಟುಂಬ: ಸಕ್ರಿಯ ಮತ್ತು ಧೈರ್ಯಶಾಲಿ. ಶಬ್ದಕೋಶ ಅನ್ವಯ ಅತ್ಯುತ್ತಮ, ಆದರೆ ತಿಳಿದ ಪದಗಳನ್ನು “ಹೆಚ್ಚು ಸರಿ” ಎಂದು ಭಾವಿಸಿ ಮನಬಂದಂತೆ ಬದಲಾಯಿಸುತ್ತದೆ. “Gemini 3 Flash” ಎಂದು ಹೇಳಿದ್ದನ್ನು “Gemini 1.5 Flash” ಎಂದು ತಿದ್ದುತ್ತದೆ — ತಿಳಿದ ಪದಗಳೇ ಹೆಚ್ಚು ಅಪಾಯಕಾರಿ ಹ್ಯಾಲುಸಿನೇಷನ್ ಗೆ ಕಾರಣವಾಗುತ್ತವೆ.
- Claude ಕುಟುಂಬ: ವಿನಯಶೀಲ ಮತ್ತು ಸುರಕ್ಷಿತ. ಏನನ್ನೂ ಹಾಳುಮಾಡುವುದಿಲ್ಲ, ಆದರೆ ಶಬ್ದಕೋಶ ಅನ್ವಯದಲ್ಲಿ ಆತ್ಮವಿಶ್ವಾಸ ಕಡಿಮೆ.
ತೀರ್ಮಾನವಾಗಿ, ಸಂಸ್ಕರಣೆ ಮೂಲತಃ ಅಗತ್ಯವಿಲ್ಲದ್ದು, ಮತ್ತು STT ಮಾದರಿಗಳೇ ಮುಂದುವರಿದಂತೆ ಅದು ಅಗತ್ಯವಿಲ್ಲದಂತಾಗುತ್ತದೆ ಎಂದು ನಾನು ಭಾವಿಸಿದೆ.
ElevenLabs Scribe V2 ನ ಭೇಟಿ
ಅಂತಿಮವಾಗಿ ನಾನು ಭೇಟಿಯಾದದ್ದು ElevenLabs Scribe V2.
ಅಲ್ಲಿಯವರೆಗೆ ಈ ಕಂಪನಿಯ ಬಗ್ಗೆ ನನಗೆ ಏನೂ ಗೊತ್ತಿರಲಿಲ್ಲ, ಆದರೆ ಈ ಮಾದರಿ ಬೆರಗುಗೊಳಿಸುವಂತಿತ್ತು. ವಿಯೆಟ್ನಾಮೀಸ್, ಜಪಾನೀಸ್, ಇಂಗ್ಲಿಷ್ — ಭಾಷೆ ಯಾವುದಿರಲಿ, ಪಠ್ಯ ಪರಿವರ್ತನೆಯ ನಿಖರತೆ ಹೆಚ್ಚಿತ್ತು. ಜಪಾನೀಸ್ನಲ್ಲಂತೂ, ನನ್ನ ವೈಯಕ್ತಿಕ ಅನುಭವದಲ್ಲಿ, OpenAI ಯ ಮಾದರಿಗಳಿಗಿಂತ ಮುಂದಿದೆ ಎಂದು ಭಾವಿಸುವ ಮಟ್ಟದಲ್ಲಿತ್ತು.
ಶಬ್ದಕೋಶಕ್ಕಾಗಿ ಪ್ಯಾರಾಮೀಟರ್ಗಳೂ ಸಿದ್ಧವಾಗಿವೆ — ಡೆವಲಪರ್ಗೆ ಸ್ನೇಹಿ ವಿನ್ಯಾಸ. ಸಂಸ್ಕರಣೆ ಇಲ್ಲದೆಯೂ ಸಾಕಷ್ಟು ಗುಣಮಟ್ಟ ಸಿಗುತ್ತದೆ. koedesk ಇದೀಗ Scribe V2 ಯನ್ನು ಪೂರ್ವನಿಯೋಜಿತ ಮಾದರಿಯಾಗಿ ಬಳಸುತ್ತಿದೆ.
ಸಂಸ್ಕರಣೆ ಇಲ್ಲದೆಯೇ, ಇತರ ಆ್ಯಪ್ಗಳಿಗಿಂತ ಮುಂದಿನ ಗುಣಮಟ್ಟದ ವಸ್ತು ತಯಾರಾಗಿದೆ — ಕನಿಷ್ಠ ಜಪಾನೀಸ್ನಲ್ಲಂತೂ, ಎಂದು ನಾನು ಆತ್ಮವಿಶ್ವಾಸದಿಂದ ಹೇಳಬಲ್ಲೆ.
ಈಗಿನ ನನ್ನ ಅಭಿವೃದ್ಧಿ ಪರಿಸರ
ಇಂತಹ ಪ್ರಯಾಣದ ನಂತರ, ಇಂದು ನನ್ನ ದೈನಂದಿನ ಜೀವನದಲ್ಲಿ ಬಳಸುವ AI ಸಾಧನಗಳು ತೀರಾ ಕಡಿಮೆ. Claude Code ಮತ್ತು koedesk. ಈ ಎರಡೇ ಪಟ್ಟಿಯಲ್ಲಿರುವುದು.
ಬೇರೆ ಮಾತುಗಳಲ್ಲಿ, Claude Code ಬಿದ್ದರೆ ನಾನು ಸ್ವತಃ ಒಂದು ಪುಲ್ ರಿಕ್ವೆಸ್ಟ್ನ್ನೂ ಮಾಡಲಾಗದೆ ಹೋಗುತ್ತೇನೆ. ಅಷ್ಟರ ಮಟ್ಟಿಗೆ ಅವಲಂಬಿತನಾಗಿದ್ದೇನೆ.
ಈ ಲೇಖನದ ಸ್ವಂತ ಕಾರ್ಯಪ್ರವಾಹ
ವಾಸ್ತವವಾಗಿ ಈ ಲೇಖನವೇ ಧ್ವನಿ ಇನ್ಪುಟ್ನ ಪ್ರಾತ್ಯಕ್ಷಿಕೆಯಾಗಿದೆ.
- koedesk ನಲ್ಲಿ ಮಾತಾಡಿ ಪಠ್ಯವಾಗಿ ಪರಿವರ್ತಿಸುವುದು
- Claude Code ನಿಂದ ಪಠ್ಯವನ್ನು ಮುದ್ರಣಯೋಗ್ಯ ಮಾಡಿಸುವುದು
- Claude Code Git ರೆಪಾಸಿಟರಿಯನ್ನು ನಿರ್ವಹಿಸಿ push ಮಾಡುತ್ತದೆ
- Zenn Connect (GitHub ಸಂಯೋಜನೆ) ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪ್ರಕಟಿಸುತ್ತದೆ
ಕೀಬೋರ್ಡ್ ಅನ್ನು ನಾನು ಬಹುಮಟ್ಟಿಗೆ ಮುಟ್ಟಿಲ್ಲ.
ಧ್ವನಿ ಇನ್ಪುಟ್ ಪ್ರಯತ್ನಿಸಿ ನೋಡಬಾರದೇ?
AquaVoice ಬಗ್ಗೆ ತಿಳಿದವರಿಗೆ “ಆ, ಆ ಅನುಭವ” ಎಂದು ತಕ್ಷಣ ಗೊತ್ತಾಗಬಹುದು. ಆದರೆ ಇನ್ನೂ ಧ್ವನಿ ಇನ್ಪುಟ್ ಅನುಭವಿಸದವರೂ ಸಾಕಷ್ಟು ಮಂದಿ ಇರಬಹುದು.
ವಿಶೇಷವಾಗಿ ಜಪಾನೀಸ್ ಭಾಷೆಯ ಬಳಕೆದಾರರಿಗೆ, koedesk ನ ಪೂರ್ವನಿಯೋಜಿತ ಮಾದರಿಯಾದ ElevenLabs Scribe V2 ಯ ಜಪಾನೀಸ್ ಗುಣಮಟ್ಟವನ್ನು ಸ್ವತಃ ಅನುಭವಿಸಬೇಕೆಂದು ನಾನು ಬಯಸುತ್ತೇನೆ. koedesk ಅನ್ನು ದಿನಕ್ಕೆ 5 ನಿಮಿಷಗಳವರೆಗೆ, ಅವಧಿಯಿಲ್ಲದೆ, ಕ್ರೆಡಿಟ್ ಕಾರ್ಡ್ ಅಗತ್ಯವಿಲ್ಲದೆ ಯಾವಾಗಲೂ ಉಚಿತವಾಗಿ ಬಳಸಬಹುದು. ಇಷ್ಟವಾದರೆ, ತಿಂಗಳಿಗೆ 10 ಡಾಲರ್ ನ Pro ಪ್ಲ್ಯಾನ್ನಲ್ಲಿ ಪಠ್ಯ ಪರಿವರ್ತನೆ ಅಮಿತವಾಗುತ್ತದೆ.
ಈ ಲೇಖನ ಧ್ವನಿ ಇನ್ಪುಟ್ ಎಂಬ ಹೊಸ ಇನ್ಪುಟ್ ಇಂಟರ್ಫೇಸ್ನೊಂದಿಗೆ ನಿಮ್ಮ ಮೊದಲ ಪರಿಚಯವಾಗುವಂತಾದರೆ ತುಂಬಾ ಸಂತೋಷ.
ಆರಂಭದ ಮಾತಿಗೆ ಮರಳಿದರೆ — ನನ್ನ ಒಂದು ಗುಪ್ತ ಮಹತ್ವಾಕಾಂಕ್ಷೆ. koedesk ಅನ್ನು ಧ್ವನಿ ಇನ್ಪುಟ್ ಜಗತ್ತಿನ Happy Hacking Keyboard ಆಗಿಸಬೇಕೆಂದು ನಾನು ಬಯಸುತ್ತೇನೆ. …ತಮಾಷೆ, ಕ್ಷಮಿಸಿ. ಆದರೆ ಅರ್ಧದಷ್ಟು ನಿಜ.
ಕೊನೆಯ ಮಾತು
ಮುಂದೆಯೂ koedesk ನ ಅಪ್ಡೇಟ್ ಮಾಹಿತಿ, ಮತ್ತು ಇಂದಿನ Speech-to-Text ನ ಪರಿಸ್ಥಿತಿ ಇಂತಹ ವಿಷಯಗಳ ಬಗ್ಗೆ ಲೇಖನಗಳನ್ನು ಬರೆಯುತ್ತಲೇ ಇರಬೇಕೆಂದು ಭಾವಿಸುತ್ತೇನೆ.
ಜೊತೆಗೆ, ನಾನು ದೈನಂದಿನ ಕೆಲಸದಲ್ಲಿ AI ಏಜೆಂಟ್ಗಳನ್ನು ಬಳಸುವಾಗಿನ ತಂತ್ರಗಳು — ನಿಮಗೆ ಉಪಯುಕ್ತವಾಗಬಲ್ಲ ಏನಾದರೂ ಇದ್ದರೆ — ಇಂತಹ ರೂಪದಲ್ಲಿ ಹಂಚಿಕೊಳ್ಳಬೇಕೆಂದು ಭಾವಿಸುತ್ತೇನೆ.
ಆಗಬಹುದಾದರೆ, ಮುಂದೆಯೂ ನನ್ನೊಂದಿಗೆ ಜೊತೆಗೂಡಿದರೆ ಸಂತೋಷ.
Masaki Kondo — CEO, Guide Inc. Vietnam https://koedesk.app