Přeskočit na obsah
AI & Produktivita · 10 min čtení

Klávesnice je pomalá. Vždycky byla.

Mluvíte 3× rychleji než píšete. Jak hlasové zadávání změnilo celý můj pracovní den a proč by mělo změnit i váš.

TL;DR

Člověk mluví rychlostí kolem 120 slov za minutu. Píše 50. Postavil jsem si na to vlastní aplikaci Uttero, která je zdarma ke stažení. Za hodinu diktování zaplatíte 12 centů přes API kredit na přepis.

Přes 80 % firem zatím z AI nic nemá. Průměrný manažer ji používá necelých 13 minut denně. Hlasové zadávání je nejsnazší způsob, jak AI začít reálně používat. Mluvíte, AI přepíše, vy upravíte. Žádné složité nastavování.

Klíčové body

  • Člověk mluví rychlostí 120 slov za minutu, píše 50. Ten trojnásobný rozdíl mění celý přístup k práci s textem.
  • Uttero je zdarma ke stažení. Za hodinu diktování zaplatíte 12 centů přes API kredit, tedy za reálně spotřebovaný přepis.
  • Přes 80 % firem z AI zatím nic nemá. Průměrný manažer ji používá necelých 13 minut denně.
  • Přes Uttero diktuju e-maily, poznámky, přepisy z videí na YouTube, brainstorming. Z pláže, z gymu, odkudkoli.
  • Strach z prázdné stránky při diktování zmizí. Mluvit je přirozené, člověk to dělá od dvou let.
  • Firmy, které AI reálně nasadily na déle než rok, vidí kolem 11,5% nárůst produktivity.
  • API kredit místo měsíčního předplatného. Platíte za to, co skutečně použijete, a rozumíte tomu, za co platíte.

Klávesnice je pomalá. Vždycky byla.

0:00
0:00

Sedím v gymu v Hua Hinu, je 8:15 ráno, přede mnou kafe a laptop.

Nedotýkám se klávesnice. Mluvím.

Za 15 minut mám hotové e-maily, poznámky k projektu, vytvořené super zadání pro novou appku i draft téhle věty, kterou právě čtete. Ještě před 2 lety by mi tohle zabralo hodinu nebo víc. A možná bych u toho zadání seděl a civěl na blikající kurzor na prázdné stránce.

Průměrný člověk mluví rychlostí třeba 120 slov za minutu. Píše 50. Ta matematika je jednoduchá a brutální.

Postavil jsem si na diktování vlastní aplikaci. Jmenuje se Uttero. Je vytvořená pro mé workflow, je na webu ke stažení zdarma. Tenhle newsletter je o tom, jak hlasové zadávání změnilo celý můj pracovní den. A taky věřím, že i o tom, aby vás pošťouchl k tomu začít s tím taky. Včetně jednoho experimentu, který zabere přesně pár minut.


I. Rychlost, kterou ignorujete

Mluvím od dvou let. Psát se učím od šesti. Na ten čtyřletý náskok myslím pokaždé, když otevřu ústa místo sahání na klávesnici.

Peter Steinberger, člověk za projektem OpenClaw s 220 000 GitHub hvězdičkami, prohlásil v rozhovoru s Lexem Fridmanem, že ztratil hlas od přílišného diktování do AI. Ali Abdaal zařadil hlasové zadávání jako třetí pilíř AI fluency. Dva nezávislí lidé z odlišných světů došli ke stejnému závěru.

Lidé často sedí u klávesnice a přemýšlí, jak začít první větu.

Blank page paralysis. Prázdná stránka, blikající kurzor, mozek zamrzne. Při diktování tohle neexistuje, alespoň podle mých zkušeností. Mluvit je přirozené.

AI přepis dnes dosahuje podle Jeffa Su přesnosti přes 95 %. Změřené to nemá, ale můj odhad by byl po měsících, kdy primárně texty diktuju, podobný. V češtině to možná bude nižší, ale i tak velmi vysoké číslo. Třeba u Soniox, který primárně na svých projektech používám já, je přesnost obrovská. Whisper (případně gpt-4o-transcribe) na tom byl s češtinou trošku hůř, ale pořád bych ho jako záložní variantu bral. Totéž platí o lokálních modelech.

Mám rád přístup hlas jako první draft. Mluvíte, AI přepíše, udělá první korektury, vy pak upravíte podle sebe. Přesně tohle workflow jsem implementoval do Uttero. Celý cyklus trvá zlomek času oproti psaní na klávesnici. Klávesnici pak používáte jen na opravu věcí, které nemá smysl zadávat jako prompt. Ano, samozřejmě v případě, že ty nesrovnalosti přepisuju často, je užitečné zamyslet se nad tím proč a řešit to dříve, než se to stane.


II. Proč 80 % firem z AI nic nemá

“We tend to overestimate the effect of a technology in the short run and underestimate the effect in the long run.” Roy Amara

6 000 manažerů, jeden vzorec – přes 80 % firem reportuje nulový produktivitní přínos z AI. Miliardy investic. Žádný výsledek.

Zároveň údajně top manažeři používají AI v průměru 90 minut týdně. To je méně než 13 minut denně.

Třináct minut.

Pro mě jako člověka, který tráví v podstatě polovinu pracovního času v Claude Code a druhou polovinu přemýšlí o nových nápadech a během toho si je diktuje do svých aplikací, je to nepředstavitelné. Diktuju naprostou většinu svých textů. E-maily, poznámky, drafty, komunikaci. Denně.

Rozdíl mezi 13 minutami týdně a reálnou integrací do workflow je propastný.

Firmy, které AI používají déle než rok, reportují průměrně 11,5% nárůst produktivity. AI nefunguje plošně. Funguje tam, kde se firmy rozhodly ji skutečně nasadit, investovaly do implementace a daly tomu čas. Průměr přes celou ekonomiku zatím vypadá nezáživně. Ale špička už vidí zajímavé přínosy.

Mluví se o možném J-curve efektu. Nejprve nic, pak rychlý nárůst. Podobně to fungovalo s počítači v 80. letech. Jenže většina lidí to vzdá v té ploché části křivky. Vyzkouší pár promptů v ChatGPT nebo Microsoft Copilot. Zjistí, že to není nic extra, a vrací se zpátky ke starým rutinám.

Je to produktivita bez záměru. Člověk si zaregistruje nástroj, zkusí pár promptů, nic zásadního se nestane, odloží to. Chybí konkrétní problém, který chce vyřešit.

Když jsem začínal s hlasovým zadáváním, neřekl jsem si „vyzkouším to”. Řekl jsem si: „Ok, Gamrote, trávíš více než dvě hodiny denně psaním textů, co takhle to pořádně zrychlit?” No a krůček po krůčku jsem došel k diktování. Konkrétní problém. Konkrétní řešení. Měřitelný výsledek.

Tenhle přístup mě extrémně pomáhá v mnoha oblastech. Vědět, co chci, a jít si za tím. Klidně ať je to ambiciózní. Zkoušení jsme měli dost ve škole. Teď máme úžasný prostor pro práci na záměrech.


III. Uttero: proč jsem si postavil vlastní appku

Lopata vám pomůže kopat rychleji, ale jámu za vás nevybere.

Existují desítky aplikací na hlasový přepis. Podle mě jsem zkoušel asi úplně všechny. Wispr Flow, MacWhisper, superwhisper. Některé jsem zaplatil jednorázově, jiné stály měsíční poplatek. Žádná nedělala přesně to, co jsem potřeboval.

Tak jsem si jednu vytvořil v prosinci sám.

Jmenuje se Uttero. Postavil jsem ji přes vibe coding bez programátorského vzdělání nebo know how. Funguje jednoduše. Mluvíte, Uttero to přepíše, naformátuje a je to. Vy pak upravíte, hlasem nebo jako poslední možnost – na klávesnici. Máte na výběr z různých stylů, jako jsou e-maily, zprávy nebo třeba překlady do angličtiny. Styly si vytváříte i sami. Můžete využívat textovou expanzi hlasem, hlasové pokyny, přeformátování textu po nadiktování, opravy a podobně. Těch funkcí tam je hodně. Ale zároveň jsem se snažil Uttero designovat tak, aby bylo minimalistické. V základu stačí držet jednu klávesu a pak ji pustit, jakmile máte hotovo. Tvořil jsem celý nástroj tak, aby naprosto sedl do mého workflow.

Je hodně pravděpodobné, že vám nebude sedět. A taky je pravděpodobné, že si Uttero zamilujete. Vyzkoušejte, uvidíte. Každopádně z hlediska přesnosti přepisu v češtině a funkcí, jako je třeba realtime náhled na to, co diktujete, je to naprostá špička. Neříkám to jen jako hrdý otec, ale jako každodenní uživatel, který v něm nadiktoval přes 48 hodin poznámek, e-mailů, instrukcí a kdo vé čeho.

Kdybyste si ji chtěli vyzkoušet, tady je zdarma. Platíte jen API kredit na Soniox nebo OpenAI.

Tady se většina lidí zarazí. „API kredit? To zní komplikovaně.” Zvykejte si. Ne na komplikované věci, ale na to, že tyhle „komplikace” budou standardní. Stejně, jako je už dnes standardní, že se dají snadno vyřešit. Zní to strašidelně jen proto, že jste to nikdy nezkusili. A že jste se na to nezeptali chatGPT nebo Claude.

API kredit = zaplatíte za to, co reálně spotřebujete. Whisper API stojí $0.006 za minutu. Šest tisícin dolaru. Za hodinu diktování zaplatíte 36 centů. Soniox, který používám, je ještě levnější a vyjde na cca 12 centů za hodinu.

Srovnejte si to s měsíčním předplatným za $10, $15, $20, které platíte i když nástroj nepoužíváte.

A je tu bonus, který většina lidí docení až zpětně. Tím, že si nastavíte API kredit, vytvoříte API klíče apod., naučíte se chápat další souvislosti. Přestane to být černá skříňka. Pochopíte, co platíte, za co platíte, a proč. Tohle je digitální gramotnost v praxi. Ne teoretický kurz.

Uttero najdete na mém webu v sekci nástroje, kde mám přehled i dalších nástrojů, které jsem za poslední dva měsíce postavil. Na stejném webu jsou i firemní školení, předběžná registrace do beta komunity Master the Flow a webinář o vibe codingu. Nepředstírám, že to nepropaguju. Samozřejmě propaguju. Protihodnota je ale konkrétní a měřitelná.


IV. Pět míst, kde hlasový přepis nečekáte

Nejlepší interface je žádný interface.

Většina lidí si pod hlasovým zadáváním představí diktování poznámek nebo zpráv. To je zlomek toho, co jde udělat.

Kontaktní formulář na mém webu je napojený na Soniox. Návštěvník nemusí psát, stačí nadiktovat za půl minuty vlastními slovy. Výsledek jsou delší a konkrétnější zprávy, které dávají smysl. Průměrný kontaktní formulář stojí člověka 2 minuty psaní špatně formulované zprávy. Hlasový vstup? Třicet sekund a přirozená formulace. Zkuste si to třeba tady. Třeba mi napište, tedy nadiktujte, jak se vám ten newsletter zatím čte.

E-maily. Odpovídám na většinu e-mailů diktováním. Z pláže, z gymu, z procházky. Telefon v ruce, mluvím, AI přepíše, pošlu.

YouTube Transcribe pipeline. Automaticky přepisuje videa z kanálů, které sleduji, dělá sumáře, které posílá do Notero (další moje aplikace, tentokrát na poznámky, knowledge base, propojená s celým mým ekosystémem), podle mého profilu vytahuje relevantní části. Posílá reporty na denní bázi. Běží sám, bez mého zásahu, bez provozních nákladů. Rozhoduji se podle sumáře a AI doporučení, jestli se na video dívat, nebo ne.

Hlasový asistent na webu, který funguje přes ElevenLabs agenty. Naviguje návštěvníky, odpovídá na otázky. Zatím rarita, ale za rok to bude standard. Má to hodně much a mějte s ním, prosím, trpělivost. Každopádně, kdybyste ho chtěli vyzkoušet, najdete ho v pravém dolním rohu na mém webu.

Samozřejmě taky brainstorming odkudkoli. Na procházce, v posteli, při cvičení. Napadne vás myšlenka, nadiktujete ji, AI přepíše. Žádný zápisník, žádné „zapomněl jsem to”. Dávám to do Capto for iOS a to to ukládá, kam potřebuju.

Hlasový přepis je meta-vrstva. Mění váš vztah k textu a komunikaci. Člověk přestane přemýšlet stylem „musím si sednout a psát” a začne přemýšlet stylem „prostě to řeknu”.


V. SaaS je pronájem. API je vlastnictví.

Platím jen za to, co reálně použiju. A vím přesně kolik.

Kolik platíte měsíčně za nástroje, které používáte jednou týdně?

SaaS model funguje jednoduše. Platíte fixní částku za přístup. Používáte, nepoužíváte, platíte stejně. Pro poskytovatele skvělý byznys. Pro vás pronájem. Neříkám, že je to špatně. Odpadá vše kolem, prostě je to pohodlné. Využíval jsem SaaS mraky let a platil tisíce korun měsíčně za používání. Vlastně jsem si nedokázal představit, že by to mohlo být jinak. Dokud nepřišel vibe coding.

U API kreditu platíte za reálné použití. Minutu přepisu. Jeden dotaz. Konkrétní výstup. Nic navíc.

Můj YouTube Transcribe pipeline jsem vytvořil v rámci Claude Code předplatného. Mám Max verzi. A ano, zaplatil bych i SuperMax. Řeším přes něj naprostou většinu pracovních projektů. Provozní náklady na YouTube Transcriber jsou nulové, protože přepisy, sumarizace a reporty běží na lokálních modelech.

Uttero je zdarma, platíte jen za přepis, který reálně vytvoříte. Za měsíc to jsou pro většinu z vás jednotky korun i při větším využití. Jasně, že i tam jdou využít lokální modely. Ale není to pro každý hardware a zároveň ta kvalita není až tak velká. Rozhodně doporučuju sáhnout spíš po těch online.

A pak je tu ještě jedna věc.

Když platíte za SaaS, jste závislí na rozhodnutích někoho jiného. Změní cenu? Platíte víc. Zruší funkci, kterou používáte? Smůla. Přidají funkce, které nepotřebujete? Platíte za ně stejně.

Když pochopíte, jak na své procesy vytvářet řešení, máte větší kontrolu. Víte, co se děje. Víte, kolik to stojí. A hlavně – můžete si postavit přesně to, co potřebujete. Ne víc, ne míň. Začněte s tím. Ideálně hned dneska. Stačí první jednoduchý krok. Třeba se přihlásit na webinář.

Vzniká digitální vlastnictví. Člověk přestane být v zajetí předplatných a začne stavět vlastní infrastrukturu. Zní to velkohubě, ale v praxi to znamená, že jedna appka postavená za odpoledne vám bude šetřit hodiny každý týden. Permanentně. A nejen to, může přinést novou hodnotu. Vám. Rodině. Firmě. Společnosti.


Experiment týdne

Zítra ráno, místo bušení prvního e-mailu na klávesnici zkuste ten e-mail nadiktovat. Nemusíte instalovat nic speciálního. Stačí nativní diktování ve vašem telefonu (funguje v iOS i Androidu). Pokud byste chtěli propracovanější, ale přesto minimalistický nástroj, sáhněte po Wispr Flow.

Nadiktujte, přečtěte, upravte, pošlete. Změřte si čas. Srovnejte s tím, jak dlouho vám obvykle trvá napsat podobný e-mail na klávesnici. Postupem času se v tom budete ještě více zdokonalovat a budete taky zrychlovat.

Dejte tomu několik šancí. Opakujte. Vracíte se zpět k něčemu, co jste se naučili ve dvou letech – k mluvení. Brzy to bude zase vaše přirozenost.


Za poslední dva měsíce jsem postavil jedenáct vlastních nástrojů, které téměř denně používám. A pak samozřejmě desítky, které skončily v koši. Programovat neumím. Ale vím přesně, co chci, a mluvím rychleji, než píšu.

Tyhle dvě dovednosti tvoří dohromady hodně silný tým.

#gamrot

Sdílet: LinkedIn X
AI hlasové zadávání Uttero workflow produktivita
Daniel Gamrot

Daniel Gamrot

Expert na osobní produktivitu a moderní technologie. 13+ let pomáhám lidem pracovat líp a žít spokojeněji.

Více o mně →

Tohle byl článek z mého newsletteru

Odběratelé ho dostali 23. února 2026. Přihlaste se a příště u toho budete taky.

Master the Flow

NOVÉ

Komunita pro lidi, kteří chtějí pracovat líp. Živé akce, materiály a tipy, co fungují. 490 Kč/měsíc.

Zjistit víc →

Potřebujete vyřešit něco na míru?

50 minut online. Produktivita, nástroje a AI. Individuální přístup. 5 900 Kč bez DPH.

Více o konzultaci →