Portaalist

Sõnaveeb on Eesti Keele Instituudi uus sõnastikuportaal, kuhu on koondatud keeleinfo instituudi paljudest sõnakogudest ja andmebaasidest. Kuvatav info pärineb Ekilexist, uuest Eesti Keele Instituudi hallatavast ja arendatavast sõnastiku- ja terminibaasisüsteemist. 2018. aasta detsembri seisuga sisaldab Ekilex üle 50 sõnakogu, nii üldkeele sõnaraamatuid kui ka oskussõnastikke. Sõnaveebis kuvatakse esialgu seitsme sõnakogu ja andmebaasi infot. Portaalis on umbes 130 000 eestikeelset sõna ja väljendit ning umbes 70 000 venekeelset sõna ja väljendit. Sõnaveebi arendatakse ja täiendatakse pidevalt: lisatakse uusi sõnu ja tähendusi, infot järgmistest sõnakogudest, uusi kasutajamugavusi, korrastatakse olemasolevat esitust. Sõnaveebi versiooni uuendatakse ja arhiveeritakse kord aastas.

2019. aastal ilmub Sõnaveebis kaks uut Eesti Keele Instituudis koostatud sõnaraamatut: “Eesti keele sõnaraamat 2019” ja “Eesti keele naabersõnad 2019”. Lisaks saab siin kasutada algajale keeleõppijale mõeldud “Eesti keele põhisõnavara sõnastikku 2019” (1. trükk 2014).

Sõnaveebis ilmub ka kaks kakskeelset sõnaraamatut: 10 000 uue sõnaga täiendatud “Eesti-vene sõnaraamat 2019” (1. trükk 1997–2009) ja “Eesti-vene õpilase ÕS 2019” (1. trükk 2011).

Sõnaveebi jaoks on sõnastikes ühtlustatud homonüümide ja grammatilise info esitust, parandatud trükivigu.

Eesti keele sõnavormide info pärineb “Eesti Keele Instituudi eesti keele morfoloogilisest andmebaasist 2019”. Vene keele sõnavormide info pärineb “Eesti Keele Instituudi vene keele morfoloogilisest andmebaasist 2019”.

Sõnaveebiga on seotud ka üks uus eesti keele korpus: “Eesti keele õppekorpus 2018 etSkell”. Sellest korpusest päritakse veebilauseid korpuspäringusüsteemi KORP API kaudu.

Portaali loomist ja arendamist on rahastanud Haridus- ja Teadusministeeriumi digipöörde programm (2018–2021) ja EKI-ASTRA programm (2016–2022). Sõnastiku- ja terminibaasisüsteemi Ekilex loomist on rahastanud EKI-ASTRA programm (2016–2022).

Arendaja OÜ TripleDev.

Eesti keele info: EESTI KEEL -> EESTI KEEL

Eesti keele infot kuvatakse, kui Sõnaveebis on valitud suund EESTI KEEL -> EESTI KEEL. Kasutaja saab valida kahe infoesitusviisi vahel: Detailne või Lihtne.
DETAILNE vaade näitab kogu infot, mis otsitava sõna kohta Sõnaveebis olemas on. Pikemaid infoüksusi saab täielikult avada “Näita rohkem” nupu alt.
LIHTNE vaade näitab vähem infot, siin on vähem sõnu, samuti on info esitatud lihtsamal kujul: seletused on lühemad, lisamaterjali on vähem, seletusi täiendavad pildid ja õppekommentaarid. Lihtne vaade on mõeldud eeskätt õppijale.

Vene keele info: EESTI KEEL -> VENE KEEL

Vene keele infot kuvatakse, kui Sõnaveebis on valitud suund EESTI KEEL -> VENE KEEL või VENE KEEL -> EESTI KEEL. Kasutaja saab valida kahe infoesitusviisi vahel: Detailne või Lihtne. DETAILNE vaade näitab infot, mis pärineb “Eesti-vene sõnaraamatust 2019” (1. trükk 1997–2009). „Eesti-vene sõnaraamatusse 2019” on lisatud umbes 10 000 uut eesti märksõna koos vene tõlkevastetega. Pikemaid infoüksusi saab täielikult avada “Näita rohkem” nupu alt.
LIHTNE vaade näitab infot, mis pärineb “Eesti-vene õpilase ÕS-ist 2019” (1. trükk 2011). Siin on vähem sõnu, samuti on info esitatud lihtsamal kujul. Lihtne vaade on mõeldud eeskätt õppijale.


Tähelepanu! Suuna VENE KEEL -> EESTI KEEL vasted on saadud eesti-vene sõnastike automaatse pööramise teel. Sel põhjusel võivad vasted olla ebaharilikus järjekorras, samuti esineb siin kordusi.

Detailne ja lihtne vaade

Kasutaja saab ise valida, kas ta eelistab näha põhjalikumat infot (DETAILNE) või lihtsamalt ja lühemalt esitatud infot (LIHTNE). Kui lihtsas valikus küsitud sõna puudub, suunatakse kasutaja detailse info juurde.

Sama kujuga sõnad ehk homonüümid

Eesti keeles on umbes 1000 sõna, mille kirjakuju langeb kokku mõne teise sõnaga, aga mille tähendus on täiesti erinev. Sellised sõnad on homonüümid. Näiteks: palk ‘töötasu’ ja palk ‘langetatud puu’; tee ‘sõidutee’ ja tee ‘jook’; pits ‘võrkkudum’, pits ‘väike napsiklaas’ ja pits ‘piibuvarre osa’. Kõige rohkem ehk 5 homonüümi on Sõnaveebis neljal sõnal: matt, mutt, tikk ja viik. Nendest viigil näiteks: viik ‘püksisääre volt’, viik ‘võrdne tulemus’, viik ‘viigimari’, viik ‘lahesopp’ ja viik ‘millegi viimine kuskilt välja’.

Valdav osa homonüümidest on väga lühikesed sõnad, nad on aja jooksul kulunud lühemaks. Sõnaveebis kuvatakse sama kujuga sõnad eraldi mullidena, kus sõnal on homonüüminumber juures (valge number sinise ringi sees).

Uued sõnad ja tähendused

Sõnaveeb sisaldab umbes 17 000 uut sõna ja 1300 uut tähendust, mis pärinevad “Eesti keele sõnaraamatust 2019”.

Uute sõnade hulgas on uudiskeelendeid ehk neologisme, aga ka sõnu, mis on keeles ammu olemas, ent pole varem üldkeele sõnaraamatuis seletuste ja näidetega varustatuna esinenud.

Uudiskeelendeid ehk neologisme on umbes 5000. Need on sõnad ja ühendid, mis on kasutusse tulnud viimase paarikümne aasta jooksul ning mida keelekasutajad tajuvad uuena. Nad tähistavad hiljaaegu meie ellu astunud nähtusi, asju, omadusi või tegevusi, näiteks: erisoodustusmaks, eelhääletus, eeslinnastumine, euroskeptitsism, e-valimised, vastustaja, makroanalüütik, asümmeetriline sõda, elektrooniline võru ja elektronvõru, veebimajutus, manageerima, puuküürnik, putinism, hapu laen, infoväli, islamimaailm, islamiseeruma, islamofoobia; küüslauguvõi, maitsesool, kabotša, flamm; epiduraalanesteesia, kompuutertomograaf, mammograafiabuss ja mammobuss, unearst, hapnikuvõlg; maalilaager, kelguhoki, kendo, enduuro, eeterkeha ja eeterlik keha, sisekosmos, energiaväli, üliteadvus, sekstiil.

Pärisnimesid on valikus umbes 1300. Enamasti on need riigi-, koha-, organisatsiooni-, sündmusenimed ja müütilised või kirjanduslikud isikunimed, näiteks Allah, Beneluxi maad, Checkpoint Charlie, Hendriksoni küür, Paks Margareeta, Sossi mägi, Stromka, Taliban, Tšornobõl ja Tšernobõl, Valhalla, Ämblikmees. Pärisnimesid kirjeldatakse samamoodi nagu mis tahes muid sõnu: tuuakse välja nende sisu, kirjakuju, muutmisviis, kasutuskontekst, paralleelvorm(id) jm keelekasutaja jaoks oluline info.

Sõnaveebis on esitatud suur hulk ühendeid, mida varem pole iseseisvate üksustena käsitletud, ent mis keelekasutuses sellisena sageli ilmnevad. Need ühendid on üldtuntud ja „vanad“, ent varem on nad ära toodud kas näidete hulgas (koos seletusega või ilma) või jäänud sõnaraamatust üldse välja. Sellised on näiteks: alkohoolne jook, baaside leping, elu ja surma küsimus, häälest ära, identsed kaksikud, klassikaline filoloogia, löömaks minema.

Omaette sõnadena on esitatud iseseisva sõnatähenduse saanud tegusõna- ja nimisõnavorme, nt kadunud (‘hukkumisele või läbikukkumisele määratud’), kaelani (‘täiesti, üleni, läbinisti’).

Rohkesti on ka kõnekeelseid või normatiivses keelekasutuses taunitud sõnu, mis esinevad tänapäeva eesti keeles, ent seletavas üldkeele sõnaraamatus varem fikseeritud pole olnud, näiteks eputrilla, tatsipau, alukad, jummel, peika, pruta, sitsiprintsess, sasku, munapiiks, glasnost, samizdat, stange.

Uute lisandunud tähenduste puhul on hakatud olemasolevat sõna kasutama uues tähenduses harilikult mingi sarnasuse alusel või on võõrsõna tähendus teise keele mõjul avardunud. Näiteks sõna lõim on omandanud tähenduse ‘programmi haru, mis võimaldab mitut tegevust täita samaaegselt või vaheldumisi’, sõna kodakondne tähenduse ‘mingi riigi kodanik’ ja sõna opereerima tähenduse ‘mingit tehnilist või ettevõtete süsteemi (või seadet) juhtima, vastavaid töid teostama ja korraldama’.

Päritolu

Sõnaveebis esitatakse infot sõnade ja vahel ka väljendite päritolu kohta. Sõna päritolu on kirjeldatud umbes 20 000 sõna juures. Päritoluinfo pärineb uuest “Eesti keele sõnaraamatust 2019”. Sõna päritoluinfo on koostanud Udo Uibo.

Sõnade päritolu selgitus võib olla erinev. Kõigepealt on esile toodud päritolu liik: põlissõna, laensõna, kõlasõna, nimi, tootenimi, tõlkelaen, pooltõlkelaen, kirjakeele sõna või tehissõna. Seejärel on vajaduse järgi esitatud muud infot: vasted teistes keeltes, levik sugulaskeeltes, tehissõna autor ja loomise aeg.

Põlissõna. Need on vanemad sõnad, mille kohta pole teada, et nad oleksid laenatud, aga ka sellised eesti sõnavara ürgseimasse kihti kuuluvad sõnad, millel on küll selge vaste mõnes teises keelkonnas (näiteks mesi, muna, tooma, vask, vesi), kuid mille laenulisus pole ikkagi ühemõtteliselt kindel. Põlissõnade puhul on näidatud nende levik sugulaskeeltes ja esitatud maksimaalselt kolm näidet. Leviku iseloomustamisel on kasutatud järgmisi kategooriaid (kursiivis on esitatud näiteks olevad sõnad):

  • uurali sõna (vaste vähemalt ühes samojeedi keeles): ei, elama, kaaren,
  • soome-ugri sõna (vaste vähemalt ühes ugri keeles): kolm, kuru, köis,
  • läänemeresoome-permi sõna (vaste vähemalt ühes permi keeles): jäse, kaas, amb,
  • läänemeresoome-volga sõna (vaste mari keeles): jahvatama, haab, ihuma,
  • läänemeresoome-mordva sõna (vaste mordva keeltes): inimene, istuma, aher,
  • läänemeresoome-saami sõna (vaste saami keeltes): hiilgama, hõbe, ilves,
  • läänemeresoome sõna (levinud mitmes läänemeresoome keeles, kusjuures vaste on olemas nii vepsa kui ka liivi keeles): matma, habras, jäme,
  • piiratud levikuga läänemeresoome sõna (levinud mitmes läänemeresoome keeles): helmes, hirm, hulkuma,
  • läänemeresoome lõunarühma sõna (levinud eesti, liivi ja vadja keeles): kudrutama, matma, niiske,
  • eesti-soome sõna: eblakas, edenema, puju,
  • eesti-liivi sõna: hullama, käi, maru,
  • eesti-vadja sõna: jõhvikas, otsus, vaatama.

Laensõna. Need on sõnad, mis on laenatud teistest keeltest. Märgitud on laenuallikas või laenuallikad, uuemate laenude puhul enamasti konkreetne keel (nt alamsaksa, saksa, vene, soome), vanemate puhul keelerühm (nt aarja, balti, germaani). Kui lähtekeele sõna on omakorda laenatud, on võimaluse korral püütud esitada kogu teekond, kuidas ta on mitmeid keeli läbides eesti keelde jõudnud: näiteks koma < saksa Komma 'koma' < ladina comma 'lõige, lõik, tsesuur' < kreeka komma 'löök, lõige, lõik'.

Kõlasõna. Need on niihästi otsesed kõlajäljendused (onomatopoeetilised sõnad) kui ka nende ülekandelised kasutamisjuhud (nn onomatopoeetilis-deskriptiivsed sõnad). Kui võimalik, on kõlasõnade puhul esitatud sugulaskeelte vasteid, näiteks sõnadel helisema, huikama, inisema, kaagutama. Alati pole aga selge, kas sugulaskeeltes on tegemist ühe ja sama iidse sõna vastetega või hiljem eri keeltes iseseisvalt tekkinud sõnadega. Niisugustel segastel juhtudel on piirdutud lihtsalt märgendiga kõlasõna, näiteks karsumm, hõkk, hops, joba, jonks, hubisema.

Nimi ja tootenimi. Kui sõna on pärit pärisnimest või tootenimest, siis osutavad seda märgendid nimi ja tootenimi: näiteks kutt pärineb mehenime Gustav familiaarsest lühikujust Kutt, kets Ameerika firma US Rubber Company kummitallaga spordijalatsite tootemargist Keds, barbi tootenimest Barbie.

Tõlkelaen ja pooltõlkelaen. Tõlkelaenud on niisugused liitsõnad ja väljendid, mis on eesti keeles loodud mõne teise keele liitsõna või väljendi tõlkena: inglise chain smoker > eesti ahelsuitsetaja, inglise Internet of things > eesti asjade internet. Pooltõlkelaenude puhul on sõna või väljendi üks osa laenatud, teine tõlgitud: saksa Bubikragen > eesti bubikrae, vrd saksa Bubi ‘poiss, poisu, poisike’ ja Kragen ‘krae’.

Kirjakeele sõna ja tehisõnad. Päritolu käsitlus ei ole Sõnaveebis pelgalt tüvekeskne (nagu „Eesti etümoloogiasõnaraamatus“), vaid võimalust mööda on kaasa haaratud ka tuletisi, liitsõnu ja väljendeid. Suur osa selliseid keelendeid on eesti keeles üpris uued, kirjakeele arendamiseks teadlikult loodud. Tuletiste ja väliseeskujuta liitsõnade puhul katab niisuguseid juhtumeid märgend kirjakeele sõna: adrik, aheraine. Võimaluse korral on esile toodud ka sõna autor ja loomisaeg: lõigend – Harald Põld 1910, aimekirjandus – Harry Õiglane 1974. Sadakonna kunstlikult loodud tüvisõna puhul on kasutatud märgendit tehissõna. Nende puhul on autor ja loomisaeg enamasti teada ja ka esitatud: lünk – Johannes Aavik 1917/1921, etlema – Ain Kaalep 1969.

Hääldus

Võõramate nimede, lühendite ja teistest keeltest tulnud sõnade puhul on sõnadele lisatud hääldus: Ali Baba [alii babaa], alma mater [alma maater], cappuccino [kaputšiino], KGB [kaa-gee-bee], TalTech [tal-tehh, tal-tek].

Hääldust saab Sõnaveebis ka kuulata, selleks tuleb klõpsata kõlari märgile. Kuulatavad hääldused on pärit „Võõrsõnade leksikoni“ (2015) veebiversioonist. Häälduse on sisse lugenud eesti emakeelega inimesed, kes valdavad vastavat võõrkeelt väga hästi, hääldus on originaalilähedane. Hääldused on Eesti Keele Instituudis salvestatud 2016. aasta lõpus ja 2017. aasta alguses.

Kuulata saab ka mõnede muutevormide hääldust, selleks tuleb klõpsata kõlari märgile sõnavormide juures: sõna lill juures saab kuulata vorme lill (nimetav kääne), lille (omastav), lille (osastav). Omastava ja osastava vorm erinevad oma välte poolest. Kuulatavad sõnavormide hääldused on pärit „Eesti keele põhisõnavara sõnastiku“ (2014) veebiversioonist. Sõnavormide hääldused on Eesti Keele Instituudis salvestatud 2013. aastal. Häälduse lugesid sisse Eva Klemets ja Marju Avamere.

Kuulata saab ka näitelausete hääldusi, selleks tuleb klõpsata kõlari märgile eestikeelse näitelause kõrval. Näitelauset loeb arvuti, mitte inimene. Tegemist on Eesti Keele Instituudis loodud tehishäälega, mida on kasutatud mitmetes kõnesünteesi rakendustes.

Dikteeri!

Sõnaveebis saab otsingusõna või -väljendit ka dikteerida. Selleks tuleb sisse lülitada otsingulahtris olev mikrofon ning see pärast dikteerimise lõppemist välja lülitada. Veebibrauser saadab reaalajas kõne TTÜ Küberneetika Instituudi serverisse, kus see muudetakse tekstiks ning saadetakse brauserisse tagasi.

Parima tulemuse saamiseks tuleks dikteerida selge häälega ja mõõdukas tempos (umbes nagu raadiodiktor).

Kõnetuvastuse rakendus on valminud riikliku programmi Eesti Keeletehnoloogia (2011–2017) projekti Kõnetuvastus raames TTÜ Küberneetika Instituudi foneetika ja kõnetehnoloogia laboris. Rakenduse loojad on Tanel Alumäe (serveritarkvara, kõnetuvastus) ja Kaarel Kaljurand (serveriga suhtlev Javascripti moodul).

Sõnavormid

Eesti keele sõnamuutmise info on pärit “Eesti Keele Instituudi eesti keele morfoloogilisest andmebaasist 2019”.

Sõna juures saab näha tema muutevorme kolmes eri valikus.

Lühivalikus on ainult kõige olulisemad muutevormid:
  • muutumatul sõnal tema ainus vorm: homme; erakordselt
  • käändsõnal nimetav, omastav, osastav ainsuses ja mitmuses: pood, poe, poodi; poed, poodide, poode ~ poodisid
  • pöördsõnal kindla kõneviisi oleviku ainsuse 3. pööre, ma-tegevusnimi, da-tegevusnimi, tud-kesksõna: kütab; kütma, kütta, köetud

Kui sõna saab käänata või pöörata mitmel moel (mitme eri muuttüübi järgi), siis näidatakse mitut paradigmat: muuseum – osastavas muuseumi või muuseumit; koer – osastavas koerte või koerade; kõnelemada-vorm kõnelda või kõneleda.

Rohkem vorme saab tellida nupu „Näita rohkem“ alt.

Detailses vaates avanevad kõik võimalikud muutevormid, mida sõnast saab moodustada. Vormigruppe eristavad vahepealkirjad, nt ainsus, mitmus; pöördelised vormid.
Lihtsas vaates on samad vormid, kuid lihtsamal (vähendatud) kujul: kuvamata jäävad käändsõna rohked mitmuse rööpvormid, mis on kasutusel väheste sõnade puhul.

Muutevormid on vaikimisi harilikul kirjakujul. Hiirega vormi peale liikudes ilmub nähtavale täpsem info iga vormi kohta: vormi täielik nimi ja muutevormi morfonoloogiline kuju.

Morfofonoloogilises kujus on näidatud:
  • 3. välde (`): `ammu
  • ebaregulaarne rõhk (´): ait´üma
  • piir muutevormi tüve ja muutelõpu vahel ([): k`ümble[b, k`ümble[ma
  • liitsõnadel liitsõnapiirid (+ või -): esma+t`ähtis.

Ilma sõnamuutmise infota jäävad väljendid (aia taha minema, veri keeb, ühe raksuga), lühendid (cm, sen), esiosad (giga-) ja tsitaatsõnad (adagio).

Ka osa tavalisi sõnu on esialgu veel ilma muutevormideta, see osa täieneb edaspidi.

Vene keele sõnamuutmise info on pärit “Eesti Keele Instituudi vene keele morfoloogilisest andmebaasist 2019”.

Sõna seosed

Sõna seostena esitatakse Sõnaveebis otsitava sõnaga mingil viisil seotud sõnad ja väljendid: võrdlusvorme, tuletisi, sarjasõnu, täiendsõnu ja ühendeid.

Võrdlusvormid. Võrdlusvorme näidatakse omadussõnade ja määrsõnade juures: punane – keskvõrre punasem, ülivõrre kõige punasem, punaseim; kaugel – keskvõrre kaugemal.

Tuletised. Mõned tuletised on Sõnaveebis esitatud lihtsalt nimetusena, ilma iseseisva kirjelduseta. Kui otsida sõna punaselt, saab Sõnaveebist teada, et see on moodustatud sõnast punane. See tähendab, et sõna punaselt info saab kasutaja kaudselt kätte põhisõna punane juurest, mis ise on Sõnaveebis kirjeldatud täies mahus. Põhisõna enda juures on lisainfona kirjas, et sellest saab moodustada sõna punaselt.

Sarjasõnad. Eesti keelele on omased määrsõnadest või sõnaühenditest moodustuvad sarjad, mis mõnikord on kolmikud, mõnikord paarid: arvel : arvele : arvelt; küüsis : küüsi : küüsist; lahus : lahku; otsa ees : otsa ette : otsa eest; uppis : uppi. Sõnaveebis on sellised sarjad seosega seotud. Kui otsida sõna arvel, saab teada, et samas sarjas esinevad ka sõnad arvele ja arvelt. Sarjasõnana esinevad kõige sagedamini seisundit või kohta tähistavad määrsõnad või sõnaühendid. Kõik sarjasõnad on kirjeldatud iseseisva sõnana.

Täiendsõnad. Pärisnimedest moodustatud erikujulised täiendsõnad esitatakse Sõnaveebis sarnaselt tuletistega: näidatakse mis sõnast nad on moodustatud või millist täiendsõna saab otsitud sõnast moodustada. Nii on omavahel seotud pärisnimi Gröönimaa ja sellest saadud täiendsõna Grööni, Hiiumaa ja Hiiu, Udmurtia ja Udmurdi. Kõik täiendsõnad ja pärisnimed on kirjeldatud iseseisva sõnana.

Ühendid. Otsitud sõna juures loetletakse ühendid, kus otsitav sõna ühe koostisosana esineb. Näiteks punane juures on ühendid: Aafrika punane tee, hari läheb punaseks, punane planeet, punane raamat jt. Kõik ühendid on kirjeldatud iseseisva sõnana.

Ühendid

Sõnaveebis esitatud ühendid pärinevad uuest “Eesti keele sõnaraamatust 2019”.

Ühenditena esitatakse sõnaühendid, mis inimese mälus arvatavalt talletatakse tervikuna ning mis vajavad arusaamiseks kas otsest või kasutuskontekstile osutavat seletust. Need võivad olla nii fraasid kui terviklaused. Kõik ühendid on esitatud omaette märksõnana, neil on oma tähendusjaotus, seletused ja näited. Ühendid on loetletud ka nende koostisosaks oleva sõna juures: trügima juures on viide ühendile ette trügima, sõnade kirju ja koer juures on viide ühendile kirju koer.

Ühendina on esitatud:
  • ühendverbid: ette trügima, järele kontrollima, kokku arvutama
  • ühendsidesõnad: kui et, nii et, niikaua kui
  • metafoorsed, ekspressiivsed väljendid: ajusid pesema, täispangale minema, vale puu all haukuma
  • idiomaatilised noomeniühendid (ka pärisnime sisaldavad): kirju koer, tarkade kivi, Achilleuse kand, Ameerika mäed, onu Heino
  • väljendverbid: nägu tegema, pahaks panema, silma jääma
  • idiomaatilised püsivõrdlused: nagu kulda, raha nagu ratsahobuse sitta, täis nagu templielevant
  • terminiühendid ja terminilaadsed ühendid: absoluutne kuulmine, erakorraline meditsiin, helkivad ööpilved, Hispaania avang, huvide konflikt
  • keelte nimetused, vaegomadussõnalise täiendiga ühendid: aramea keel, akadi keel, krimmitatari keel, katoliku kirik, luteri usk
  • mitmesõnalised pärisnimed: Vaikne ookean, Ameerika Ühendriigid, Liibüa kõrb
  • isolaadi ehk ainukordse komponendi ja verbi ühendid: luuslanki lööma, peksa saama, plehku pääsema
  • kaassõnalised ühendid: au sees, mitut pidi, ookeani taga, pöidla all, püssi alla
  • lauselised ütlused (ka mõned kõnekäänud ja vanasõnad): mis liig, see liig, näitan, kuidas Luukas õlut teeb, uhkus ajab upakile, vanajumal oli lätlane
  • mitmesugused vormelid ja retoorilised hüüatused: asi nudi, head aega, okas päkka, põrgu päralt, tere tulemast, tohoh tillae

Teist tüüpi ühendid on naabersõnad ehk kollokatsioonid. Need on sõnad, mis esinevad keeles sageli koos, näiteks sõnapaarid noor inimene, hea inimene, inimene elab, inimene mõtleb. Naabersõnad aitavad nii edasijõudnud keeleõppijat kui emakeelset kõnelejat teksti loomisel. Naabersõnade info pärineb sõnakogust “Eesti keele naabersõnad 2019”.

Tähendused

Sõnaveebi selgroo moodustab uus “Eesti keele sõnaraamat 2019”, kust on pärit keskne sõnatähenduste info. Tähendusjaotuse tasandeid on kaks: põhitähendus ja alltähendus. Alltähendused on teataval viisil põhitähendusega seotud, sellest tuletatud, tavaliselt kas veidi kitsamad või laiemad kui põhitähendus. Üldjuhul on nad põhitähendusega tihedamini seotud kui teine põhitähendus. Põhitähendused on loetletud numbritega: 1, 2, 3 jne. Alltähendused on põhitähenduste alljaotised: 1.1, 1.2, 1.3 jne. Nii põhitähendus kui ka alltähendus võib sisaldada semikooloniga eraldatud väga lähedast, muul viisil raskesti eristatavat osa.

Sõnatähendusi ei ole võimalik täpselt mõõta: kui sõnal on väga palju alltähendusi, on lihtsam rida katkestada ja esitada tähendus uue põhitähendusena. Nii on toimitud ka uues eesti keele sõnaraamatus. Detailses vaates on kasutajale näha kõik põhitähendused ja alltähendused. Lihtsas vaates avanevad üksnes õppijale mõeldud lihtsamas sõnastuses põhitähendused.

Võrreldes eelmise seletava sõnaraamatuga (1988–2007, 2. trükk 2009) on uues eesti keele sõnaraamatus tähenduse seletusi oluliselt lihtsustatud, samuti on vähendatud tähenduste arvu. Kui varem oli sõnal käima 22 tähendust, siis nüüd on “kõigest” 7 tähendust. Ka sõnal tõmbama oli varem 22 tähendust, aga nüüd on 9. Tähenduste üldistamine on aidanud sõnatähendusi kokku võtta.

Sõnu, mis lauses võivad esineda mitme sõnaliigi, näiteks määrsõna ja kaassõna (peale) või määrsõna ja nimisõna (natuke) positsioonis, on käsitletud ühe sõnana. Selliste sõnade kirjeldamiseks sobib pigem polüseemia, kuna tähendused oma põhiosas ei erine. Erineb vaid süntaks. Eelmises, “Eesti kirjakeele seletavas sõnaraamatus” (1988–2007, 2. trükk 2009) olid sellised sõnad grammatilise põhimõtte tõttu lahutatud eraldiseisvateks sõnadeks: näiteks sõna peale oli jagatud kolmeks (!) eri sõnaks, millel kokku oli koguni 39 (!) põhitähendust (postpositsioonina 21, prepositsioonina 4 ja adverbina 14 tähendust). Sõnaveebis on sõnal peale tähendused koondatud 10 põhitähenduse alla. Lihtsas vaates on 8 lühikese seletusega tähendust.

Tähendused on üldjuhul järjestatud sageduse järgi: esikohal on keeles kõige sagedamini ettetulev tähendus. Alati pole seda põhimõtet rakendatud: mõnd sõna on olnud parem seletada, arvestades ajaloolist järgnevust või otsese-ülekantud tähenduste suhet: enne varasem tähendus, siis hilisem; enne otsene tähendus, siis ülekantud tähendus (selgroog).

Tähenduste juures on antud mitmesugust lisainfot, eeskätt entsüklopeedilist infot või nõuandeid sõnakasutuse kohta. See on info, mida on hea teada. Näiteks väljendi ladina kool juures saab teada, et “ladina koolid panid aluse gümnaasiumide tekkele”. Sõna pealuu juures on täpsustatud, et “anatoomiatermin on kolju”. Sõna neitsiõli juures on märkus, et “keelenõu soovitab kasutada kas külmpressitud oliiviõli või külmpress-oliiviõli”. Sõna laplane juures on kirjas, et “sõna laplane võib mõjuda tänapäeva keelekasutuses vananenult. Neutraalne on nende omanimetus saam”.

Sõnaliigi info on Sõnaveebis esitatud sõna juures (mitte sõnatähenduse juures). Sõna võib kuuluda mitmesse sõnaliiki: peale (määrsõna, kaassõna), haige (omadussõna, nimisõna).

Tähendussuhted

Sõnaveebis on esitatud valik sõna tähendussuhteid muude sõnadega: sünonüümid, antonüümid, kaashüponüümid ja sarnassõnad (ehk paronüümid).

Sünonüümid. Need on tähenduse poolest sarnased, ent kujult üksteisest erinevad sõnad. Sõnaveebis on nad näidatud tähenduse juures selgituse “sama mis” abil: burleskne sama mis jämekoomiline; hingetoit sama mis vaimutoit.

Antonüümid. Need on teatava tähendusliku tunnusjoone poolest vastandlikud sõnad, kusjuures nende muu tähendussisu langeb kokku. Sõnaveebis on nad näidatud tähenduse juures selgituse “vastand” abil: absoluutne vastand suhteline; reesuspositiivne vastand reesusnegatiivne.

Kaashüponüümid. Need on sõnad, mis on ühesuguses suhtes oma ülemmõistega, olles ülemmõiste suhtes samaväärsed alammõisted. Nad on kõrvutatavate eristustunnustega sõnad. Sõnaveebis on nad näidatud tähenduse juures selgituse “võrdle” abil: peamõis võrdle abimõis; riigimets võrdle eramets.

Sarnassõnad ehk paronüümid. Need on kõlalt ja sageli kujult osaliselt sarnased sõnad, mis keeletarvitajal võivad segi minna. Sõnaveebis on nad lihtsas vaates näidatud tähenduse juures selgituse “ära aja segi” abil: ehitus ära aja segi ehitis; õieti ära aja segi õigesti.

Naabersõnad

Naabersõnad on sõnad, mis esinevad keeles sageli koos. Igal keelel on eriomaseid sõnade kombinatsioone, mille tundmine on vajalik, et oleks võimalik selles keeles loomulikult ja ladusalt rääkida ning kirjutada. Näiteks eesti keeles öeldakse kange kohv ja lahja kohv, mitte tugev kohv või nõrk kohv, aga inglise keeles just strong coffee ja weak coffee. Naabersõnade esitamise eesmärk on aidata eelkõige keeleõppijat ja muuta tema keelekasutus sarnaseks emakeelse kõneleja omaga. Naabersõnade info pärineb sõnakogust “Eesti keele naabersõnad 2019”.

Sõnaveebis saab naabersõnu vaadata umbes 10 000 sõna juures, mis on välja valitud sageduse alusel. Otsitava sõna juures on naabersõnad rühmitatud sõnaliikide kaupa, vastavalt sellele, kas märksõna esineb koos omadussõna, pärisnime, määrsõna, tegusõna, nimisõna või kaassõnaga. Näiteks sõna kohv esineb kõige sagedamini koos omadussõnadega kange, kuum, kofeiinivaba jne. Tegusõnadest on esikohal: kohv aurab, (kohv) jahtub, (kohv) ergutab. Nimisõnadest on sagedamad: kohvi joomine, (kohvi) hind, (kohvi) valmistamine.

Naabersõnu saab vaadata ka mõnede mitmesõnaliste tegusõnade juures (nt aru saama, alla kirjutama).

Iga rühma sees on naabersõnad omakorda paigutatud eri ridadele, kui märksõna või tema paarilise vorm muutub. Näiteks kui otsida sõna töö, on tööd tegema, tööl käima ja töölt lahkuma esitatud erineval real.

Iga rühma või rea alguses on antud näidis koos märksõnaga, mis näitab, millises vormis selle rea naabersõnad esinevad. Kui naabersõnade näidis on kohv aurab, jahtub, ergutab, siis vastavad naabersõnade paarid on kohv aurab, kohv jahtub, kohv ergutab.

Naabersõnade info on saadud “Eesti keele ühendkorpusest 2013”. Automaatselt loodud sisu on põhjalikult toimetatud ja vigadest puhastatud.

Naabersõnade kasutamist illustreerivad Sõnaveebis näitelaused. Üldjuhul on antud vähemalt üks näitelause rühma kohta. Kuna naabersõnu on palju, on näitelaused esialgu peidus, et anda sõnapaaridest kiiresti võimalikult terviklik pilt. Kui vajutada kirjale “Kasutusnäited”, avaneb iga rühma all vähemalt üks näitelause.

Rektsioon ehk sõltumine

Rektsioon näitab millist grammatilist vormi nõuab mingi sõna teistelt tema koos erinevatelt sõnadelt. Sõnaveebis kirjeldatakse rektsiooni mitmesuguste küsimuste abil: põhinema – millel; usk – kellesse-millesse; viha – kelle-mille vastu; tahe – mida teha; kade – kelle-mille peale; tutvuma kellega-millega jne. Rektsiooni kasutamist keeles näitab näitelause.

Rektsioonid kuvatakse nii detailses kui lihtsas vaates.

Näitelaused

Näidete valikul on toetutud “Eesti keele ühendkorpuse 2013”, hiljem “Eesti keele ühendkorpuse 2017” andmetele. Näitelause toetab seletust ja aitab tähendust paremini mõista. Näitelaused on valitud võimalikult loomulikud, mõnel määral on näitelauseid sõnaraamatu jaoks kohandatud. Pikemaid infoüksusi saab täielikult avada “Näita rohkem” nupu alt.

Näitelaused illustreerivad ka naabersõnade kasutamist. Üldjuhul on antud vähemalt üks näitelause rühma kohta. Kuna naabersõnu on palju, on näitelaused esialgu peidus, et anda sõnapaaridest kiiresti võimalikult terviklik pilt. Kui vajutada kirjale “Kasutusnäited”, avaneb iga rühma all vähemalt üks näitelause.

Sõnaveebi lihtsas vaates kuvatakse õppijale mõeldud lühemad ja lihtsamad näitelaused.

Lisaks leksikograafi hoolikalt valitud näidetele esitab Sõnaveeb ka automaatselt valitud ja toimetamata veebilauseid. Kuna veebilauseid valib arvuti, mitte inimene, siis võib näidete hulka sattuda ebatäpsusi või suisa vigaseid lauseid. Eesti Keele Instituudis arendatakse veebilausete programmi edasi, nõnda muutuvad veebilaused edaspidi täpsemaks.

Veebilaused

Veebilaused on arvuti poolt automaatselt valitud autentsed laused, mis pärinevad “Eesti keele õppekorpusest 2018 (etSkELL)”. Need on eesti keele õpikute, erinevate meedia-, ilukirjandus- ja teadustekstide ning eestikeelse Wikipedia laused. Õppekorpus sisaldab umbes 25 mln lauset ja 250 mln sõna. Korpusest päritakse veebilauseid korpuspäringusüsteemi KORP API kaudu.

Veebilaused on valitud spetsiaalse programmi (Good Dictionary Example ehk GDEX) abil, toetudes lause teatud tunnustele. Lause pikkus peab olema 3 kuni 20 sõna, lause ei tohi sisaldada väga harva esinevaid sõnu ega väga pikki sõnu jm. Veebilauseid ei ole toimetatud. Veebilausetes esineb otsitav sõna eri vormides: kui otsida sõna lammas, siis lausetes esinevad ka vormid lambaid, lambaile, lammastega jm.

Kuna veebilauseid valib arvuti, mitte inimene, siis võib näidete hulka sattuda ebatäpsusi või suisa vigaseid lauseid. Arvuti ei oska veel teha vahet sõna eri tähendustel: kui kasutaja otsib sõna leht, siis esinevad veebilausetes nii ajalehe, paberilehe, puulehe kui ka veebilehe laused. Arvuti ei erista ka homonüüme: otsingu tamm puhul on veebilausetes läbisegi nii tamme (‘puu’) kui ka tammi (‘vesiehitis’) näited. Segadusi põhjustavad ka eri sõnade kokkulangevad vormid (ehk vormihomonüümia): otsingule kalla (‘lill’) pakub arvuti vastuseks lauseid, kus tegemist on tegusõna kallama vormiga. Eesti Keele Instituudis arendatakse veebilausete programmi edasi, nõnda muutuvad veebilaused edaspidi täpsemaks.

Sagedusinfo

Sõnaveebis on tähistatud 20 000 sagedama sõna sagedusklass. Sagedusandmed pärinevad “Eesti keele ühendkorpusest 2017”. Kolme tärniga sõnad on eesti keeles kõige sagedamini esinevad sõnad: korpuses kuuluvad nad 5000 kõige sagedama sõna hulka. Kahe tärniga sõnad on sageduselt järgmises rühmas: nad kuuluvad kuni 10 000 kõige sagedama sõna hulka. Üks tärn on sõnadel, mis on sagedusloendis kuni 20 000 kõige sagedama hulgas.

Eri keeleoskustasemete sõnavara

Keeleõppija vajadusi silmas pidades pakutakse Sõnaveebis infot selle kohta, mis taseme sõnavarasse teatud sõna kuulub. Sõnaveebis on keeleoskustase märgitud 13 000 sõna juures. Tasemekohasuse määramisel on silmas peetud täiskasvanud keeleõppija vajadusi ning toetutud seni ilmunud eri keeleoskustasemete kirjeldustele, Eesti Keele Instituudis koostatud õppesõnastikele ja eesti keele korpustele. Andmed pärinevad Eesti Keele Instituudi eri keeleoskustasemete sõnavara andmebaasist etLex.

Euroopa keeleõppe raamdokumendis eristatakse algaja keeleõppija (A1, A2), edasijõudnud keeleõppija (B1, B2) ja vilunud keelekasutaja taset (C1). Sõnaveebis on tähistatud üldised tasemed A (algaja)ja B (edasijõudnud õppija): sagedusklassi tärnid on värvitud eri värviga.

Vene vasted

Lihtsa vaate venekeelsed vasted on pärit “Eesti-vene õpilase ÕS-ist 2019” (1. trükk 2011). Detailse vaate venekeelsed vasted on pärit “Eesti-vene sõnaraamatust 2019” (1. trükk 1997–2009). Sõnaveebi lisatud uute eesti sõnade vene vastete õigekirja ja grammatilise info esitamisel on kasutatud enamasti Venemaal välja antud akadeemilisi sõnaraamatuid ja elektrooniliste sõnastike portaale. Olulisemad allikad on ortograafiline akadeemiline ressurss ”Aкадемоc”, portaalid "ГРАМОТА.РУ” ja “Словари на Акакдемике”.

Tähelepanu! Suuna VENE KEEL -> EESTI KEEL vasted on saadud eesti-vene sõnastike automaatse pööramise teel. Sel põhjusel võivad vasted olla ebaharilikus järjekorras, samuti esineb siin kordusi.

Autoriõigused

Sõnaveebi autoriõiguste omanik on Eesti Keele Instituut.

Autoriõigus: Eesti Keele Instituut 2019

Kuidas Sõnaveebile viidata

Sõnaveebis esitatud sõnale või väljendile palume viidata nii:

sõna või väljend. Sõnaveeb 2019. https://sonaveeb.ee (14.2.2019)

Kui on vaja täpselt viidata mõnele Sõnaveebis olevale sõnakogule, palume seda teha nii:

sõna või väljend. Eesti keele sõnaraamat 2019. https://sonaveeb.ee (14.2.2019)

sõna või väljend. Eesti-vene õpilase ÕS 2019. https://sonaveeb.ee (14.2.2019)

Uued versioonid

Kõiki Sõnaveebi sõnakogusid täiendatakse ja toimetatakse jooksvalt, sealhulgas kasutajate tagasiside põhjal.

Sõnaveebi uus versioon luuakse ja arhiveeritakse kord aastas. Versiooni märgib aastaarv, millele on lisatud versiooni loomise kuupäev, nt Sõnaveeb 2020 (01.03.2020).

Vana versioon jääb alles. Iga versioon saab omaette püsiva identifikaatori, mida kasutatakse sellele versioonile viitamisel. Kõik versioonid registreeritakse METASHARE’is, arhiveeritakse Eesti Keeleressursside Keskuses ja Ekilexi andmebaasis.

Õpi eesti keelt

Sõnaveebi lihtsas vaates on 5000 kõige sagedamat ja olulisemat sõna, mis on piisav, et eesti keelt A2-, B1-keeleoskustasemel rääkida. Need sõnad on seletatud lihtsas keeles ja on varustatud näitelausetega. Näited näitavad, kuidas sõna lauses kasutatakse ning aitavad sõna tähendusest aru saada. Tähenduse paremaks mõistmiseks on mõnede sõnade juurde lisatud pildid. Kokku on umbes 400 pilti.

Keeleõppijat abistavad veel:

  • õppekommentaarid: näiteks sõna sada juures on kommentaar “Kui on tegemist arvudega üle tuhande, kasuta sõna sada asemel ükssada, näiteks viis tuhat ükssada. Kasuta sõna ükssada ka siis, kui ametlikus dokumendis on vaja sõnadega märkida täpne rahasumma.”
  • suhtlusväljendid: näiteks sõna isu juures on suhtlusväljend Head isu!
  • liitsõnad, mida saab otsitud sõna abil moodustada: sõna linn juures on liitsõnad kesklinn, kodulinn, pealinn, südalinn, vanalinn, äärelinn; linnaosa ja linnapea
  • info sarnassõnade kohta: näiteks ehitus ära aja segi ehitis; õieti ära aja segi õigesti
  • keelemängud
  • õppelehed, kust saab infot, kuidas eesti keeles kasutada kirjavahemärke ning kuidas kirjutada arve, kuupäevi, kellaaega jms. Maade ja rahvaste tabelis on esitatud valik maade nimesid, seal elavate inimeste ja nendega seotud keelte nimetusi.

Detailses vaates saab vaadata naabersõnu. Näiteks sõna päike juures on esitatud sõnapaarid ere päike, päike paistab ja päikest nautima. Naabersõnade eesmärk on aidata edasijõudnud keeleõppijat ja muuta tema keelekasutus sarnaseks emakeelse kõneleja omaga. Kui õppida uut keelt nö tükkidena, on keeleõppijal lihtsam selles keeles loomulikult ja ladusalt rääkida ning kirjutada.