О портале

Sõnaveeb – языковой портал Института эстонского языка, вобравший в себя информацию из многих словарей и баз данных Института эстонского языка. Информация воспроизводится из Ekilex – новой системы составления словарей, которую администрирует и развивает Институт эстонского языка. Ekilex содержит более 50 лексиконов, в том числе словари общеупотребительных слов, а также словари терминов.

Портал содержит около 130 000 эстонских слов и выражений и примерно 70 000 русских слов и выражений. Sõnaveeb постоянно развивается: добавляются новые слова и значения эстонских слов и их руссские соответствия, упорядочивается представленная информация. Версия Sõnaveeb обновляется и архивируется один раз в год.

На портале Sõnaveeb представлены «Словарь эстонского языка 2019» (Eesti keele sõnaraamat 2019), «Словарь сочетаемости слов эстонского языка 2019» (Eesti keele naabersõnad 2019), «Базовый словарь эстонского языка» (Eesti keele põhisõnavara sõnastik 2014), «Эстонско-русский школьный орфографический словарь 2019» (Eesti-vene õpilase ÕS 2019, 1-е издание 2011) и «Эстонско-русский словарь 2019» (Eesti-vene sõnaraamat 2019, 1-е издание 1997–2009).

С порталом Sõnaveeb связаны учебный корпус эстонского языка etSkell 2018 и учебный корпус русского языка ruSkELL 1.6. Для эстонского языка запросы осуществляются через API корпусного менеджера KORP, для русского языка через API корпусного менеджера Sketch Engine.

Портал создан при финансовой поддержки программы Digipöörde programm (2018-2021) и программы EKI-ASTRA programm (2016-2022). Техническую поддержу осуществляет OÜ TripleDev.

Информация, касающаяся эстонского языка, воспроизводится, если в Sõnaveeb выбрано направление EESTI KEEL -> EESTI KEEL. Информация, касающаяся русского языка, воспроизводится, если в Sõnaveeb выбрано направление EESTI KEEL -> VENE KEEL или VENE KEEL -> EESTI KEEL.

Подробный и краткий поиск

Пользователь может выбрать один из двух способов получения информации: ПОДРОБНО (Detailne) или КРАТКО (Lihtne). Подробный поиск выдаёт всю касающуюся искомого слова информацию, которая имеется на портале Sõnaveeb. Краткий поиск выдаёт меньше информации и дополнительного материала. Краткий поиск предназначен в первую очередь тем, кто изучает язык. Если в кратком поиске запрашиваемое слово отсутствует, пользователя направляют в подробный поиск.

Омонимы

В эстонском языке имеется около 1000 слов, которые совпадают по написанию с каким-нибудь другим словом, но имеют разное лексическое значение. Такие слова называются омонимами. Например: palk ‘töötasu’ (заработная плата) и palk ‘langetatud puu’(бревно); tee ‘sõidutee’(дорога) и tee ‘jook’(напиток); pits ‘võrkkudum’(кружево), pits ‘väike napsiklaas’ (рюмочка) и pits ‘piibuvarre osa’(мундштук). Больше всего, а именно пять омонимов, в Sõnaveeb имеют четыре слова: matt, mutt, tikk и viik.
В Sõnaveeb омонимы даются отдельными лексемами.


Новые слова и значения

Версия Sõnaveeb 2019 содержит около 17 000 новых слов и 1300 новых значений, которые содержатся в «Словаре эстонского языка».

Новые слова включают новообразования, или неологизмы, а также слова, которые давно вошли в язык, но ранее не встречались в словаре общеупотребительных слов в качестве объяснений и примеров.

Неологизмов насчитывается около 5000. Это слова, включая сложносоставные, которые вошли в обращение в последние двадцать лет и которые кажутся пользователям новыми. Слова обозначают явления, вещи, свойства или действия, недавно вошедшие в нашу жизнь, например: erisoodustusmaks, eelhääletus, eeslinnastumine, euroskeptitsism, e-valimisedv, vastustaja, makroanalüütik, asümmeetriline sõda, elektrooniline võru ja elektronvõru, veebimajutus, manageerima, puuküürnik, putinism, hapu laen, infoväli, islamimaailm, islamiseeruma, islamofoobia; küüslauguvõi, maitsesool, kabotša, flamm; epiduraalanesteesia, kompuutertomograaf, mammograafiabuss ja mammobuss, unearst, hapnikuvõlg; maalilaager, kelguhoki, kendo, enduuro, eterkeha ja eeterlik keha, sisekosmos, energiaväli, üliteadvus, sekstiil.

Имён собственных представлено около 1300. В основном это названия государств, организаций, событий, географические названия, а также мифические или литературные имена собственные, например, Allah, Beneluxi maad, Checkpoint Charlie, Hendriksoni küür, Paks Margareeta, Sossi mägi, Stromka, Taliban, Tšornobõl ja Tšernobõl, Valhalla, Ämblikmees.

В Sõnaveeb представлено большое количество сложноставных слов, которые ранее не рассматривались как самостоятельные единицы. Эти слова общеизвестны и употребляются давно, однако прежде они либо приводились в качестве примеров (вместе с объяснением или без него) или вообще не включались в словарь. Таковыми, например, являются: alkohoolne jook, baaside leping (договор 1939 года между Эстонией и СССР о взаимопомощи), elu ja surma küsimus, häälest ära, identsed kaksikud, klassikaline filoloogia, löömaks minema.

В виде отдельных слов даются формы глаголов и имён существительных, получившие самостоятельное значение, например: kadunud (‘hukkumisele või läbikukkumisele määratud’), kaelani (‘täiesti, üleni, läbinisti’).

Довольно много представлено разговорных слов или слов, использование которых в нормативном языке порицается, но которые встречаются в современном эстонском языке. Ранее такие слова не фиксировались в толковом словаре, например, eputrilla, tatsipau, alukad, jummel, peika, pruta, sitsiprintsess, sasku, munapiiks, glasnost, samizdat, stange.

Этимология слова

На портале Sõnaveeb даётся информация о происхождении слов, а также о происхождении выражений. Версия Sõnaveeb 2019 содержит описание этимологии примерно 20 000 слов.

Разъяснения происхождения слов могут быть различными. В первую очередь указывается вид этимологии: исконное, заимствованное, ономатопоэтическое слово, имя, название изделия, калька, полукалька, литературное или искусственное слово. Затем даётся следующая информация: соответствия в других языках, распространение в родственных языках, автор искусственного слова и время создания.

Исконное слово. Давно существующие в языке слова, о которых известно, что они не являются заимствованными, а также такие относящиеся к древнейшему слою эстонской лексики слова, которые имеют чёткое соответствие в какой-нибудь другой семье языков, но в заимствовании которых нельзя быть однозначно уверенным. При указании распространения исконных слов в родственных языках использованы следующие категории:

  • уральское слово (соответствие по меньшей мере в одном самоедском языке): ei, elama, kaaren,
  • финно-угорское слово (соответствие по меньшей мере в одном угорском языке): kolm, kuru, köis,
  • прибалтийско-финское-пермское слово (соответствие по меньшей мере в одном пермском языке): jäse, kaas, amb,
  • прибалтийско-финское-волжское слово (соответствие в марийском языке): jahvatama, haab, ihuma,
  • прибалтийско-финское –мордовское слово (соответствие в мордовских языках): inimene, istuma, aher,
  • прибалтийско-финское-саамское слово (соответствие в саамских языках): hiilgama, hõbe, ilves,
  • прибалтийско-финское слово (встречается в нескольких прибалтийско-финских языках, имеется соответствие в вепсском, ливском языках): matma, habras, jäme,
  • прибалтийско-финское слово ограниченного распространения (встречается в нескольких прибалтийско-финских языках): helmes, hirm, hulkuma,
  • прибалтийско-финское слово южной группы (встречается в эстонском, ливском и водском языке): kudrutama, matma, niiske,
  • эстонско-финское слово: eblakas, edenema, puju,
  • эстонско-ливское слово: hullama, käi, maru,
  • эстонско-водское слово: jõhvikas, otsus, vaatama.

Заимствованное слово. Это слова, усвоенные из других языков. Указывается источник или источники заимствования. Если заимствование новейшее, то, как правило, указывается конкретный язык (например, нижненемецкий, немецкий, русский, финский), если заимствование давнее, то языковая группа (например, арийская, балтийская, германская). Если слово исходного языка в свою очередь является заимствованным, по возможности указывается через какие языки слово пришло в эстонский язык.

Ономатопоэтическое слово. Представлены как слова, в которых звучание определено значением слова, так и случаи их переносного использования (т.н. ономатопоэтические-дескриптивные слова).

Имя и название изделия. Если слово происходит из имени собственного или названия изделия, то указано nimi(имя) или tootenimi (названия изделия). Например, слово kutt происходит от фамильярного сокращения мужского имени Gustav Kutt; слово kets от марки спортивной обуви Keds американской фирмы US Rubber Company; слово barbi от названия изделия Barbie.

Переводное заимствование и наполовину переводное заимствование. Переводные заимствования – это сложные слова и выражения, вошедшие в эстонский язык в результате перевода сложного слова или выражения из другого языка: англ. chain smoker > эст. ahelsuitsetaja, англ. Internet of things > эст. asjade internet. В случае, когда это наполовину переводное заимствование, одна часть слова или выражения заимствована, вторая – переведена: нем. Bubikragen > эст. bubikrae.

Литературное слово и искусственное слово. Большая часть таких слов в эстонском языке являются новыми, сознательно созданными для развития литературного языка. Такие слова отмечены как kirjakeele sõna (слово литературного языка): padrik (сошный крестьянин), aheraine (пустая порода). По возможности указан автор и дата создания: lõigend (отрывной талон) – Харальд Пыльд, 1910, aimekirjandus (научно-популярная литература) – Харри Ыйглане, 1974. Искусственно созданные слова отмечены как tehissõna. Как правило, автор и дата создания известны и указаны: lünk (пробел) – Йоханнес Аавик, 1917/1921, etlema (декламировать) – Айн Каалеп, 1969.

Произношение

Иностранные имена, сокращения и слова, пришедшие из других языков, даются в транскрипции: Ali Baba [alii babaa], alma mater [alma maater], cappuccino [kaputšiino], KGB [kaa-gee-bee], TalTech [tal-tehh, tal-tek].

Для того чтобы услышать, как произносятся слова, следует нажать на значок мегафона. Произношение даётся по электронной версии словаря иностранных слов «Võõrsõnade leksikon» (2015) и оно близко к оригинальному.

Также можно прослушать произношение основных словоформ 5000 слов, составляющих базовый лексикон эстонского языка. Для этого следует нажать на значок мегафона рядом с формами слова в разделе Sõnavormid (Формы слова).

Услышать можно произношение приводимых в качестве примера предложений, для этого следует нажать на значок мегафона рядом с предложением. Предложения генерируются при помощи синтезатора речи, разработанного в Институте эстонского языка.

Голосовой запрос

В Sõnaveeb можно также активировать голосовой поиск, произнеся искомое слово или выражение. Для этого в разделе поиска следует включить микрофон. После того как слово или выражение произнесено, микрофон следует выключить. Браузер в реальном времени направляет речь в сервер Института кибернетики ТТУ, где она преобразуется в текст и отправляется обратно в браузер.

Формы слова

Информация, касающаяся изменения слова эстонского языка, приводится из «Морфологической базы данных Института эстонского языка 2019». Информация, касающаяся изменения формы слова русского языка, приводится из «Морфологической базы данных русского языка Института эстонского языка 2019». База сгенерирована при помощи морфологического анализатора pymorphy2 на базе XML- словаря Open Corpora.

Связи слова

В Sõnaveeb наряду с искомым словом представлены связанные с ним слова и выражения: формы сравнения, производные слова, составные слова и устойчивые выражения.

Формы сравнения. Формы сравнения даются при прилагательных и наречиях: punane – сравнительная степень punasem , превосходная степень kõige punasem , punaseim ; kaugel – сравнительная степень kaugemal .

Производные слова. Некоторые производные слова представлены в Sõnaveeb без самостоятельного описания. Если ввести в поиск слово punaselt, то получим ответ, что оно образовано от слова punane.

Составные слова и устойчивые выражения. Рядом с искомым словом перечисляются слова, в состав которых оно входит.

Представлены::
  • составные глаголы: ette trügima, järele kontrollima, kokku arvutama
  • фразеологизированные глаголы: nägu tegema, pahaks panema, silma jääma
  • составные союзы: kui et, nii et, niikaua kui
  • метафорические и идиоматические выражения: täispangale minema, vale puu all haukumaб kirju koer, tarkade kivi, Achilleuse kand, Ameerika mäed, onu Heino
  • идиоматические устойчивые сравнения: nagu kulda, raha nagu ratsahobuse sitta, täis nagu templielevant
  • терминологические сочетания: absoluutne kuulmine, erakorraline meditsiin, helkivad ööpilved, Hispaania avang, huvide konflikt
  • названия языков: aramea keel, akadi keel, krimmitatari keel
  • kсочетания существительных с несклоняемыми прилагательными, предлогами и наречиям: katoliku kirik, luteri usk, ookeani taga, püssi alla
  • имена собственные: Vaikne ookean, Ameerika Ühendriigid, Liibüa kõrb
  • предложные сочетания: au sees, mitut pidi, ookeani taga, pöidla all, püssi alla
  • lauselised ütlused (ka mõned kõnekäänud ja vanasõnad): mis liig, see liig, näitan, kuidas Luukas õlut teeb, uhkus ajab upakile, vanajumal oli lätlane
  • формулы речевого этикета: head aega, tere tulemast
Устойчивые словосочетания

Устойчивые словосочетания даны для отдельных значений 10 000 наиболее частотных слов эстонского языка. Информация даётся из словаря сочетаемости слов эстонского языка “Eesti keele naabersõnad 2019”, который был составлен на основе “Национального корпуса эстонского языка 2013» («Eesti keele ühendkorpus 2013»).

Словосочетания сгруппированы на основе частеречной принадлежности тех слов, с которыми сочетается искомое слово.

Наиболее частотные типы словосочетания для существительных: прилагательное+существительное, существительное (в функции подлежащего) + глагол, существительное (в функции прямого дополнения) + глагол, существительное (в функции косвенного дополнения) + глагол, наречие+существительное и существительное+существительное. Например, слово kohv чаще всего встречается вместе с прилагательными kange, kuum, kofeiinivaba, с глаголами kohv aurab, jahtub, ergutab, с существительными kohvi joomine, kohvi valmistamine.

Наиболее частотные типы словосочетания для прилагательных: прилагательное+существительное, наречие + прилагательное, прилагательное+глагол, прилагательное+прилагательное.

Наиболее частотные типы словосочетания для глаголов: существительное (в функции подлежащего) + глагол, существительное (в функции прямого дополнения) + глагол, существительное (в функции косвенного дополнения) + глагол, наречие + глагол, глагол+глагол.

Наиболее частотные типы словосочетания для наречий: наречие + глагол, наречие + прилагательное, наречие+наречие.

В каждой группе сочетаемые слова в свою очередь сгруппированы в зависимости от грамматической формы искомого слова. Например, если в поиск ввести слово töö, то сочетания tööd tegema, tööl käima и töölt lahkuma будут представлены как отдельные группы. Для каждой группы приводятся также иллюстративные предложения.

Значения

Как правило, значения упорядочены по частоте: на первом месте наиболее часто встречающееся в языке значение. Значения подразделяются на основные (указываются под номерами 1, 2, 3 и т.д.) и подзначения, которые указываются под номерами 1.1, 1.2, 1.3 и т.д. Для отдельных значений указываются также синонимы, антонимы, паронимы, гипонимы и гиперонимы.

Лексические связи слова

Для отдельных слов даютсяследующие виды лексической связи: синонимы, антонимы, паронимы, гипонимы и гиперонимы.

Синонимы. В Sõnaveeb синонимы отмечены как sama mis (то же самое, что): hingetoit sama mis vaimutoit.

Антонимы. Слова, имеющие противоположное значение, отмечены как vastand (противоположные по смыслу слово): absoluutne vastand suhteline; reesuspositiivne vastand reesusnegatiivne.

Гипонимы и гиперонимы. Гипонимы и гиперонимы отмечены при помощи пометы võrdle (сравни): peamõis võrdle abimõis; riigimets võrdle eramets.

Паронимы. NВ Sõnaveeb паронимы отмечены как ära aja segi (не путать со словом): ehitus ära aja segi ehitis; õieti ära aja segi õigesti.

Управление.

Управление – это подчинительная связь, при которой главное слово в словосочетании требует постановки зависимого слова в определенной грамматической форме. В Sõnaveeb управление описывается при помощи различных вопросов: põhinema – millel; usk – kellesse-millesse; viha – kelle-mille vastu; tahe – mida teha; kade – kelle-mille peale; tutvuma kellega-millega и т.д.

Иллюстративные предложения

Приводимые в качестве примера предложения помогают лучше понять значение слов. Как правило, при выборе предложений за основу взяты данные “Национального корпуса эстонского языка 2017» («Eesti keele ühendkorpus 2017»).

Кроме примеров, подобранных лексикографом, Sõnaveeb показывает также предложения, взятые напрямую из учебного корпус эстонского языка etSkell 2018 и учебного корпуса русского языка ruSkELL 1.6. Для эстонского языка запросы осуществляются через API корпусного менеджера KORP, для русского языка через API корпусного менеджера Sketch Engine. Поскольку эти предложения выбирает компьютер, не исключены неточности.

Частотность

В Sõnaveeb обозначен класс частотности 20 000 наиболее часто встречаемых слов. Данные о частотности получены из «Национального корпуса эстонского языка, 2017» («Eesti keele ühendkorpus 2017»). Отмеченные тремя звёздочками слова – наиболее частотные в эстонском языке: в корпусе они относятся к 5000 самым частотным словам. Слова, отмеченные двумя звёздочками, входят в число 10 000 самых частотных слов. Одной звёздочкой отмечены слова, которые в частотном списке входят в 20 000 наиболее частотных слов.

Для изучающих эстонский язык на уровне A2-B1

В кратком поиске Sõnaveeb содержится 5000 наиболее часто используемых и значимых слов. Этого достаточно, чтобы говорить по-эстонски на уровне A2 и В1. Эти слова объяснены простым языком, даются примеры предложений, которые показывают, как используется слово в предложении, и помогают понять значение слова. Некоторые слова снабжены картинками, что помогает лучше понять их значение. Всего около 400 картинок.

Помогают изучать язык:

  • учебные комментарии
  • формулы речевого этикета: например, к слову isu (аппетит) даётся фраза Head isu! (Приятного аппетита!)
  • сложные слова, которые можно образовать на базе искомого слова: к слову linn (город) даются сложные слова kesklinn, kodulinn, pealinn, südalinn, vanalinn, äärelinn; linnaosa и linnapea
  • информация о паронимах: например, не путать слово ehitus(строительство, стройка) со словом ehitis (строение); слово õieti (собственно) со словом õigesti(правильно)
Русские соответствия

При составлении русской части портала лексикографы опираются в основном на изданные в России академические словари и порталы электронных словарей. Важнейшими источниками являются орфографический академический ресурс ”Aкадемоc”, порталы "ГРАМОТА.РУ” и “Словари на Академике”.

Авторские права

Собственником авторских прав на Sõnaveeb является Институт эстонского языка.

Авторское право: Институт эстонского языка, 2019

Как ссылаться на Sõnaveeb

На представленные в Sõnaveeb слова или выражения просим давать следующую ссылку:

sõna või väljend. Sõnaveeb 2019. https://sonaveeb.ee или http://dx.doi.org/10.0000/0000 (21.10.2019)

Версионирование

Новая версия Sõnaveeb создаётся и архивируется один раз в год. Указывается год и дата создания версии, например: Sõnaveeb 2020 (01.03.2020).

Предыдущие версии сохраняются. Каждая версия получает отдельный постоянный идентификатор, который используется при ссылке на эту версию. Все версии регистрируются в METASHARE, архивируются в Эстонском центре языковых ресурсов (Eesti Keeleressursside Keskus) и системе составления словарей Ekilex.