[PDF] Извлечение многословных словосочетаний с использованием синтаксической композиции биграмм
- Идентификатор корпуса: 17069599
title={Извлечение словосочетаний с использованием синтаксической композиции биграмм}, автор={Виолета Серетан, Лука Нерима и Эрик Верли}, год = {2003} }
- Виолета Серетан, Л. Нерима, Э. Верли
- Опубликовано в 2003 г.
- Лингвистика, информатика
предыдущее извлечение синтаксически связанных биграмм словосочетаний. Мы описываем итеративную процедуру связывания слов, которая опирается на синтаксический критерий и нацелена на построение произвольно длинных выражений, которые представляют кандидатов на словосочетания. Мы предлагаем несколько критериев ранжирования кандидатов по силе словосочетаний и представляем результаты триграммы…
archive-ouverte.unige.chИзвлечение словосочетаний на основе синтаксического разбора
- Виолета Серетан
Компьютерные науки, лингвистика
- 2008
методологическую базу для их идентификации на основе синтаксических критериев, показывающую, что полученные результаты более надежны, чем результаты стандартных методов, основанных на ограничениях линейной близости.
Ориентированный на трансляцию. Идентификация и экстракция коллокации. , который может извлекать больше словосочетаний с более высокой точностью, чем базовый уровень, что важно для задач обработки естественного языка, связанных с предложениями.
Извлечение памяти для избирательного перевода на основе статистической и лингвистической информации
- Томас С. Чуанг, Цзя-Янь Цзянь, Юй-Чиа Чанг, Джейсон Дж. С. Чанг
Лингвистика, информация
Rocling/IJClclp
- 999 2009 2009 2009 2009 20099 2009
- 9999 20099 200999009
/IJClclp
- 999 2009 2009 2009 2009 2009 2009 2009 2009 20099 20099 2009
.
Экспериментальные результаты показывают, что память фразового перевода может быть эффективно использована для компьютерного обучения языку (CALL) и компьютерного перевода (CAT).
Инструмент для извлечения и визуализации многословных словосочетаний в многоязычных корпусах
- Виолета Серетан, Л. Нерима, Э. Верли
Информатика
- 2004
Подход, лежащий в основе этой системы, является гибридным, поскольку метод извлечения сочетает синтаксический анализ текстов со статистической мерой для тест релевантности (т. е. для кандидатов, ранжируемых в соответствии с коллокационной силой).
Распознавание фреймов словосочетаний из предложений
В этом исследовании сначала извлекаются словосочетания биграмм с помощью метода, основанного на семантике распределения, путем введения шаблонов словосочетаний и интеграции некоторых современных мер ассоциации, а также получения самых длинных словосочетаний в соответствии с рекурсивной природой и лингвистическими правилами. словосочетаний.
Точная извлечение коллокации с использованием многоязычного анализатора
- Violeta Seretan, E. Wehrli
Компьютерная наука
ACL
- 2006
Гибская система. из английских, французских, испанских и итальянских корпусов.
Знакомство с сложными именами и именами собственными
- Г. Протазюк, Маржена Кришкевич, Х. Рыбински, А. Делтейл
Информатика
RSEISP
- 2007
В данной статье предлагается T-GSP как его модификация для извлечения часто встречающихся текстовых шаблонов и, в частности, часто встречающихся последовательностей слов, которые удовлетворяют заданным грамматическим правилам.
Синтаксическое согласование и обнаружение многословных выражений
В этой статье представлен усовершенствованный тип согласователя, который объединяет синтаксическую информацию о структуре предложения, а также статистическую информацию о совпадении слов для обнаружения и отображения тех слов из контекста, которые наиболее сильно относящийся к исследуемому слову.
Collocation Candidate Extraction from Dependency-Annotated Corpora: Exploring Differences across Parsers and Dependency Annotation Schemes
- P. Uhrig, S. Evert, Thomas Proisl
Computer Science
- 2018
This chapter evaluates a total of 8 синтаксических анализаторов на 2 корпуса с 20 различными показателями ассоциации плюс несколько пороговых значений частоты для 6 различных типов словосочетаний по сравнению с Оксфордским словарем словосочетаний для студентов, изучающих английский язык (2-е издание; 2009 г.).).
Приобретение перевода коллокации с использованием монолингальных корпораций
- Yajuan Lü, M. Zhou
Компьютерная наука
ACL
- 2004
. знаний и достигает многообещающих результатов в извлечении перевода словосочетаний.
ПОКАЗАНЫ 1-10 ИЗ 28 ССЫЛОК
СОРТИРОВАТЬ ПОРелевантностьНаиболее влиятельные статьиПоследность
Извлечение словосочетаний из корпусов текстов
- Л. Деканг
Информатика
- 1998
Представлен метод извлечения словосочетаний из корпусов текстов с высокой точностью и широким охватом коллокаций описывается вычисление сходства слов.
Создание многоязычного словаря словосочетаний из больших корпусов текстов
- Л. Нерима, Виолета Серетан, Э. Верли
Компьютерные науки, лингвистика
EACL
- 2003
В этой статье описывается система терминологического извлечения, способная обрабатывать многословные выражения с использованием мощного синтаксического анализатора. Система включает в себя инструмент согласования, позволяющий пользователю…
Извлечение словосочетаний из текста: Xtract
- Frank Smadja
Информатика
Comput. Лингвистика
- 1993
Описан набор методов, основанных на статистических методах извлечения и идентификации словосочетаний из больших текстовых корпусов, основанных на некоторых оригинальных методах фильтрации, которые позволяют производить более богатые и более точные выходные данные.
Словосочетания и словари общего назначения
- М. Бенсон
Лингвистика
- 1990
В последние годы лексикографы уделяют словосочетаниям повышенное внимание. 1 До сих пор обсуждение словосочетаний в основном касалось той роли, которую они могут играть в…
DEC dictionnaire explicatif et combinatoire du français contemporain
- Игорь А. Мельчук, А. Клас
Лингвистика
- 1984 900 Он пытается дать явные и недвусмысленные определения и использовать их в качестве основы для описания синтаксических и…0004
Информатика
ACL
- 1996
Новый статистический синтаксический анализатор, основанный на вероятностях зависимостей между заглавными словами в дереве синтаксического анализа, который обучается на 40 000 предложений менее чем за 15 минут и может быть улучшен до более 200 предложений в минуту с незначительной потерей точности.
Нормы словесных ассоциаций, взаимная информация и лексикография
- Кеннет Уорд Чёрч, П. Хэнкс
Лингвистика
ACL
- 1989
Предлагаемая мера, коэффициент ассоциации, оценивает нормы словесных ассоциаций непосредственно из машиночитаемых корпусов, позволяя оценивать нормы для десятков тысяч слов.
Обобщение автоматически сгенерированных схемы отбора
- R. Grishman, J. Sterling
Компьютерная наука
Coling
- 1994
Измерения степени отбора, полученного с различными положениями корпорации, и A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A является ИРКА описывается метод использования корпуса для идентификации похожих по выборке терминов и использования этого сходства для расширения охвата по выборке для фиксированного размера корпуса.
Функции обучения и масштабирования для устранения неоднозначности
- Х. Алшави, Д. Картер
Информатика
Вычисл. Лингвистика
- 1994
Представлен автоматический метод взвешивания вкладов функций предпочтения, используемых в устранении неоднозначности, и определена функция, которая работает значительно лучше, чем функции, основанные на взаимной информации и отношениях правдоподобия лексических ассоциаций.
Надежные методы анализа данных на естественном языке
Автоматизированный анализ данных на естественном языке стал центральной проблемой при проектировании интеллектуальных информационных систем, и в последнее время интерес был сосредоточен на предоставлении методов приближенного анализа, предполагая, что, когда точный анализ невозможен, частичные результаты могут быть очень полезными.
Корень слова: fin (Корень) | Membean
Латинское корневое слово fin означает «конец», как «граница» или «предел».
Все ученики знают, что 9029Экзамен 7 fin al сдается в «конце» курса. Точно так же все те, кто идет на музыкальный концерт, знают, что fin эль знаменует собой «конец» композиции. Когда вы вступаете в гонку, линия fin ish отмечает ее «конец».
То, что имеет размер fin ite, вообще не имеет «конца». Идея, лежащая в основе fin ity, заключается в том, что для него нет никакого «конца» или «предела»! В то время как в плавник ity указывает на непостижимо безграничный размер, что-то, что не имеет «конца» о том, насколько маленьким оно может быть, есть в плавник маленький. Однако когда что-то имеет размер con fin ed, оно имеет основательный «конец», поскольку вокруг него установлена «граница».
Итак, что такое fin ition? Словарь de fin ition отмечает «конец» или «предел» значений, которые имеет данное слово! С другой стороны, если описание чего-либо является inde fin ite, оно не имеет ощутимого «конца» или «границы» и, следовательно, неясно.