아마 스마트폰 키보드에서 마이크 버튼 눌러봤다가, "왜 이렇게 인식이 안 되지" 하고 껐던 경험이나, 네이버의 받아쓰기를 써봤다가 교정하는 시간이 더 오래 걸려서 그냥 타이핑으로 돌아갔던 경험들이 대다수일 겁니다.
때문에 음성 입력은 '있긴 한데, 아직은 쓸만하지 않구나' 정도로 생각하는 분들이 많으실거예요.
그러던 중, 최근 젠스파크에서 출시한 음성 인식 툴, Speakly를 써보고 생각이 변했습니다.
더 잘 받아쓰는 앱이라서 생각이 바뀐 게 아닙니다. 음성 입력이 할 수 있는 일의 범위 자체가 달랐습니다. 말하면 텍스트가 정제되고, 선택한 텍스트에 음성으로 명령을 내릴 수 있고, 심지어 AI 에이전트까지 실행돼요.
이 글은 그 경험을 정리한 활용기입니다. 혼자 쓰는 툴로서가 아니라, 조직에서 어떻게 활용할 수 있는지에 초점을 맞춰서 써봤어요.
Speakly는 받아쓰기 앱이 아니다
Speakly를 처음 접했을 때 저도 "그냥 클로바노트 같은 거 아닌가?" 싶었습니다. 받아쓰기 앱은 이미 많아요. 말하면 텍스트로 변환해주는 것, 이제 새로운 기술도 아니고요. 그런데 실제로 써보니 Speakly는 카테고리가 달랐습니다.
일반 받아쓰기 앱의 작동 방식은 단순해요. 말하면 텍스트로 바꿔줍니다. 끝이에요. 이후 편집은 내가 해야 하고, 다른 앱으로 옮기는 것도 내가 해야 하죠. 그런데, Speakly는 세 가지가 다릅니다.
•
첫째, 말하는 순간 텍스트가 정제됩니다. "음", "어", "그러니까" 같은 단어들은 자동으로 제거되고, 구어체로 말해도 문어체에 가까운 깔끔한 텍스트가 나와요.
•
둘째, 텍스트를 선택한 상태에서 음성으로 명령을 내릴 수 있습니다. 초안을 쓴 뒤 드래그하고 "이거 더 격식 있게 다듬어줘"라고 말하면, 그 자리에서 텍스트가 바뀝니다. 클립보드 복사, ChatGPT 열기, 붙여넣기, 다시 복사 — 이 과정이 통째로 사라지는 거죠.
•
셋째, 더블탭 한 번으로 Genspark 에이전트가 실행됩니다. 브라우저를 열지 않아도, "이 주제로 딥리서치 해줘"라고 말하는 것만으로 리서치가 시작돼요.
받아쓰기에서 끝나는 게 아니라, 말하는 행위 자체가 작업의 시작이자 완성에 가까워지는 식입니다.
직접 써봤더니
설치하고 나서 제일 먼저 한 건, 그냥 평소처럼 일해보는 거였습니다.
특별한 세팅 없이, 슬랙 메시지 보내듯이 Right cmd(변경 가능) 키 한 번 누르고 말해봤어요. 그랬더니 "아 이거다" 싶은 순간이 세 번 왔습니다.
1. 그냥 말하면 깔끔한 텍스트가 나온다
슬랙이든, 이메일이든, 노션이든 — 어떤 앱에 커서가 있든 상관없이 단축키 하나로 음성 입력이 활성화됩니다. 말하면 텍스트가 바로 입력되고요.
말하는 대로 텍스트가 입력되는 모습. 단축키를 누르고 말하면, 잠시 뒤 speakly가 텍스트로 변환해 줍니다.
여기서 차이가 나는 건, 제가 실제로 말하는 방식 그대로 나오지 않는다는 거예요. "그러니까 음 이번 주 금요일까지 초안 공유해주시면 좋을 것 같고요 어 그리고 혹시 가능하시면"이라고 말해도, 나오는 텍스트는 훨씬 정돈되어 있습니다. 필러 단어가 사라지고, 문장 구조가 잡혀서 나와요.
타이핑 속도가 빠른 분도 이 부분에서는 체감이 올 겁니다. 키보드로 치면 2분 걸릴 내용이 말로는 15초예요.
2. 텍스트 선택 후 음성으로 명령한다
이게 개인적으로 가장 많이 쓰는 기능입니다.
초안을 쓴 다음, 마음에 안 드는 문단을 드래그하고 말해요. "이거 좀 더 간결하게 줄여줘", "격식체로 바꿔줘", "영어로 번역해줘." 그러면 선택한 텍스트가 그 자리에서 바뀝니다.
예를 들어볼까요?
특정 메일이 있고, 이 내용을 드래그한 뒤, 단축키를 누르고 이렇게만 말해봅니다.
이 내용 격식 있는 비즈니스 메일로 바꿔줘. 한국어로
그러면 아래와 같은 결과물을 볼 수 있습니다.
Speakly를 이용해 Outlook 이메일 본문을 선택한 후 "전문적인 이메일로 바꿔줘"라는 음성 명령으로 텍스트를 재작성하는 화면. 우측에 수정된 영문 비즈니스 메일 초안이 표시되어 있다.
혹은 단순 번역을 맡길 수도 있습니다.
번역이 필요한 부분을 드래그하고, 단축키를 누른 뒤 다음과 같이 말하기만 하면 됩니다.
이거 무슨 내용인지 영어로 번역해줘.
Speakly를 이용해 일본어 텍스트를 선택하고 "영어로 번역해줘"라고 음성 명령하는 화면. 우측에 선택된 일본어 본문과 번역 진행 상태가 표시되어 있다.
기존 방식이라면 텍스트 복사 → ChatGPT 열기 → 프롬프트 작성 → 결과 복사 → 돌아와서 붙여넣기였는데, 이 흐름이 말 한 마디로 압축됩니다.
3. 더블탭으로 에이전트를 실행한다
설정한 단축를 두 번 빠르게 누르면 Genspark Agent Mode가 실행됩니다. 여기서부터는 받아쓰기가 아니라 지시예요.
"다음 주 팀 미팅 아젠다 초안 만들어줘", "이 주제로 딥리서치 해줘"라고 말하면 Genspark가 알아서 실행합니다.
Speakly의 더블탭 기능으로 Genspark 에이전트 모드를 실행하는 화면. "Genspark 에이전트 모드를 사용해 보세요" 안내와 함께 브랜드 퍼스널리티 살롱조사 실행 단계가 나열되어 있고, 하단에 Ask Genspark 입력창이 표시되어 있다.
브라우저를 열고, 탭을 찾고, 프롬프트를 타이핑하는 과정이 없어요. 데스크탑 어디서든, 지금 하던 작업을 끊지 않고 바로 실행할 수 있다는 게 핵심입니다. 로그인이 필요하긴 하지만, 빠른 일처리가 가능하다는 점은 꽤나 고무적입니다.
업무에서는 이렇게 사용해 봤습니다
개인적으로 쓰다 보니, "이건 팀 단위로 써도 되겠다"는 장면이 몇 가지 보이기 시작했습니다.
제가 실제로 체감한 두 가지예요.
슬랙 메시지 작성
팀 슬랙에서 빠르게 상황 공유할 때 많이 씁니다. 짧은 메시지라도 타이핑하다 보면 생각보다 시간이 걸리고, 문장을 다듬는 데도 신경이 쓰이거든요.
팀 Slack의 mkt-osmu-raw 채널 화면. AI 관련 링크 및 YouTube 영상이 공유된 대화 내용이 표시되어 있으며, 음성 입력으로 슬랙 메시지를 빠르게 작성하는 활용 예시 맥락에서 사용된 이미지.
말로 툭 뱉으면 정제된 텍스트로 나오니까, 슬랙 메시지 하나 보내는 데 드는 에너지가 눈에 띄게 줄었습니다.
일본어 개발자와의 소통
업무상 일본 개발자분과 커뮤니케이션할 일이 있어요. 원활한 소통을 위해 영어로 이야기하곤 했었는데, 이제는 그럴 필요가 없겠더군요.
매번 한국어로 작성 → 번역기 열기 → 복사 → 붙여넣기 → 다듬기의 과정을 반복했는데, 이제는 한국어로 말하고 "이거 자연스러운 일본어로 번역해줘"라고 하면 끝입니다. 그 자리에서 바로 교체되니까요.
Slack에서 영어로 에러 메시지를 공유한 대화 화면. "Hello, We encountered the following error message. Could you please help us resolve this issue?"라는 메시지와 함께 에러 내용 및 스크린샷이 첨부되어 있다. 한국어로 말한 내용을 Speakly로 자연스러운 영어 또는 일본어로 번역해 전달하는 활용 예시.
번역 품질도 단순 기계 번역보다 훨씬 자연스럽게 나와요. 비즈니스 맥락에 맞는 문체로 다듬어지는 게 특히 좋았습니다.
마무리
Speakly를 쓰면서 가장 크게 느낀 건, 속도보다 흐름이었습니다.
타이핑을 하다 보면 생각의 흐름이 끊기는 순간이 있어요. 머릿속엔 할 말이 있는데, 손이 따라가질 못하거나, 문장을 다듬느라 원래 하려던 생각을 놓치는 식으로요. 말로 하면 그 끊김이 줄어듭니다. 생각이 나는 속도로 바로 내뱉을 수 있으니까요.
물론 아직 완성된 툴은 아닙니다. 활성화가 가끔 늦게 되거나, 마이크 전환이 번거롭다는 점은 분명한 한계예요. 얼리스테이지 제품이라는 걸 감안하고 써야 합니다.
타이핑이 기본 입력 방식이 된 건 그렇게 오래된 일이 아닙니다. 그 전에는 손으로 쓰는 게 기본이었고, 그 전환이 일하는 방식 자체를 바꿨어요. 음성이 기본 입력 방식이 되는 흐름도 비슷하게 올 거라고 봅니다. Speakly는 그 흐름의 초입에 있는 도구로 보입니다.
'AI Native 백과사전' 구독하기
사이트를 구독하면 새 포스트 등 최신 업데이트를 알림과 메일로 가장 먼저 받아보실 수 있습니다.
Slashpage에 가입하고 'AI Native 백과사전'을 구독하세요!