Kalkulator koji priča — alat za starije i decu koja uče brojeve
Stvarni use case: kalkulator koji izgovara brojeve i operacije na srpskom. Učimo kroz primer koji su naši korisnici tražili.
Ovaj tutorial je nastao iz stvarnog zahteva korisnika: “Trebam kalkulator za moju mamu (74 god). Slabo joj je vid. Hoću da kad pritisne dugme, on naglas kaže šta je pritisla i koji je rezultat.”
Ovaj problem otkriva nešto važno o radu sa AI-em: kvalitet rezultata zavisi od kvaliteta promta. Nije isto pitati “napravi mi kalkulator” i “napravi mi kalkulator za mamu od 74 god kojoj je slab vid”.
Promt koji RADI
Napravi mi kalkulator koji glasno čita brojeve i operacije.
Korisnik je stariji, vid mu je slab — dugmad neka budu velika
i kontrastna. Boje: tamna pozadina, beli tekst.
Kad pritisne dugme za broj — tiho (samo prikaz na displeju).
Kad pritisne plus, minus, puta, kroz — naglas pročita ceo
broj koji je do sada ukucao + tu operaciju (npr. "trista
pedeset dva puta").
Kad pritisne =, naglas pročita rezultat ("jednako hiljadu
sedamsto šezdeset").
Govor mora biti na srpskom, ženski glas.
Display mora prikazivati celu računicu — ne briše se.Šta je tu specifično
- Kontekst korisnika je u promtu— “stariji, vid slab” → AI sam zaključi da treba veliki font i visok kontrast.
- Specifična pravila kada se šta dešava— “tiho za brojeve, glasno za operacije”. Ne ostavlja prostora za pretpostavku.
- Konkretan primer izgovora— “trista pedeset dva puta”. AI sad zna da pretvara cifre u reči (lokalizacija).
Tehnička stvar koju MORAŠ znati
Browseri (Chrome, Firefox, Edge) nemaju native srpski glas u window.speechSynthesis. Ako ne kažeš AI-u nikakav konkretan zahtev, on će verovatno koristiti Russian glas kao fallback — i tvoja mama će čuti nešto što zvuči kao stranac koji uči srpski.
Rešenje (kad ti zatreba prirodan glas): reci AI-u da koristi ElevenLabs Multilingual v2 model. To je cloud TTS koji ima native srpski glas kroz multi-jezički model. Free tier 10,000 karaktera mesečno — dovoljno za kalkulator.
Reci AI-u: "Za izgovor koristi ElevenLabs API umesto
window.speechSynthesis. API ključ je u env varijabli
ELEVENLABS_API_KEY (ja ću ga uneti). Voice ID:
21m00Tcm4TlvDq8ikWAM. Multilingual v2 model."Naš Skills sistem ti pomaže
Ovaj specifičan slučaj (TTS za srpski) je već u našem Skills bazi. Kad pomeneš “glas”, “čita”, “izgovara” ili “TTS”, AI automatski dobija sve ove informacije bez da ti moraš ručno da pišeš. Ne moraš da znaš tehničke detalje — sistem zna umesto tebe.
Šta da promeniš ako pravi za drugu osobu
- Za dete koje uči brojeve — dodaj “Posle svake operacije, kratko objasni šta se dogodilo”
- Za nekog koji ne čuje — preskoči TTS, dodaj velike vizuelne animacije i jak haptički feedback (vibrate API)
- Za poslovnu upotrebu — dodaj istoriju računica, export u CSV, undo/redo