Dmitry Gaivoronsky
2005-10-07 19:38:34 UTC
Ohayou gozaimasu, Konstantin.
06 окт 2005, 17:33: Konstantin Seleznyov -> All...
DG>> Т.е., провести синтаксический анализ статьи и попытаться на его основе
DG>> выделить "смысл" каждой связи. В принципе, вполне решаемая задача...
KS> Во-первых, на сколько мне известно, пока ещё нет удовлетворительного
KS> решения задачи синтаксического анализа предложений русского языка,
KS> поэтому про решаемость задачи автоматическим способом пока говорить, как
KS> мне думается, не надо
Ты говоришь об общем случае, в то время как здесь задача гораздо конкретней и
проще. Предложения в сабже относительно простые, с достаточно однообразной
структурой, кучей стандартных оборотов и т.п.
KS> Вобщем-то, системы, способные выделять ключевые слова документа и степень
KS> их взаимосвязанности уже есть. Системы эти, как я понимаю, полезны и
KS> удобны при реферировании и аннотировании больших объёмов текстовой
KS> информации, но врят ли претендуют на умение "понимать" текст.
Опять же, толковые словари специально заточены на упрощение понимания -
отточенные формулировки, никакой лирики... Т.е. присутствует лишь "логическая"
составляющая, а вся трудноформализуемая "поэзия" выкинута. Поэтому с
семантической точки зрения задача тоже значительно облегчена.
KS> Во-вторых, для упомянутого "глубокого" понимания необходимо решить ряд
KS> достаточно интересных задач: синтаксический анализ, построение тезауруса,
KS> извлечение информации (в данном случае - сопоставление фрагментов
KS> исходного текста с тезаурусом).
Идея-то как раз и состоит в том, чтобы на основе относительно простых для
анализа текстов - толковых словарей - создать некоторый более-менее
универсальный семантический "тезаурус", с помощью которого затем анализировать
уже более сложные тексты. Короче, разбить трудную задачу на две более простых.
KS> Hо самое интересное далее - это так называемый "прагматический" уровень
KS> обработки текста, заключающийся собственно в формулировании целей
KS> понимания текста, какие сведения из него должны "выуживаться". Для
KS> всевозможных чат-ботов - это поддержание беседы, для систем перевода -
KS> построение аналогичного текста на другом языке и т.д.
О прагматике тут уже немного говорилось. Hо это уже следующий уровень
обработки, и тут все зависит от цели "понимания" - для разных задач могут быть
пригодны различные методы "выуживания" и использования "выуженного" смысла.
Sayonara... Dmitry.
06 окт 2005, 17:33: Konstantin Seleznyov -> All...
DG>> Т.е., провести синтаксический анализ статьи и попытаться на его основе
DG>> выделить "смысл" каждой связи. В принципе, вполне решаемая задача...
KS> Во-первых, на сколько мне известно, пока ещё нет удовлетворительного
KS> решения задачи синтаксического анализа предложений русского языка,
KS> поэтому про решаемость задачи автоматическим способом пока говорить, как
KS> мне думается, не надо
Ты говоришь об общем случае, в то время как здесь задача гораздо конкретней и
проще. Предложения в сабже относительно простые, с достаточно однообразной
структурой, кучей стандартных оборотов и т.п.
KS> Вобщем-то, системы, способные выделять ключевые слова документа и степень
KS> их взаимосвязанности уже есть. Системы эти, как я понимаю, полезны и
KS> удобны при реферировании и аннотировании больших объёмов текстовой
KS> информации, но врят ли претендуют на умение "понимать" текст.
Опять же, толковые словари специально заточены на упрощение понимания -
отточенные формулировки, никакой лирики... Т.е. присутствует лишь "логическая"
составляющая, а вся трудноформализуемая "поэзия" выкинута. Поэтому с
семантической точки зрения задача тоже значительно облегчена.
KS> Во-вторых, для упомянутого "глубокого" понимания необходимо решить ряд
KS> достаточно интересных задач: синтаксический анализ, построение тезауруса,
KS> извлечение информации (в данном случае - сопоставление фрагментов
KS> исходного текста с тезаурусом).
Идея-то как раз и состоит в том, чтобы на основе относительно простых для
анализа текстов - толковых словарей - создать некоторый более-менее
универсальный семантический "тезаурус", с помощью которого затем анализировать
уже более сложные тексты. Короче, разбить трудную задачу на две более простых.
KS> Hо самое интересное далее - это так называемый "прагматический" уровень
KS> обработки текста, заключающийся собственно в формулировании целей
KS> понимания текста, какие сведения из него должны "выуживаться". Для
KS> всевозможных чат-ботов - это поддержание беседы, для систем перевода -
KS> построение аналогичного текста на другом языке и т.д.
О прагматике тут уже немного говорилось. Hо это уже следующий уровень
обработки, и тут все зависит от цели "понимания" - для разных задач могут быть
пригодны различные методы "выуживания" и использования "выуженного" смысла.
Sayonara... Dmitry.