Discussion:
Вопрос странный
(слишком старое сообщение для ответа)
Nickita A Startcev
2005-09-23 15:30:12 UTC
Permalink
Привет, All !


Берем Большой ТОлковый Словарь, строим следующую конструкцию: каждое слово и
каждую словоформу заменяем на запись вида <слово, часть_речи_падеж/склонение,
ссылки на другие формы этого слова, ссылки на слова, встретившиеся в этой
статье>
После прохода по словарю как-то исправляем все висячие ссылки и получаем
цельную замкнутую систему.
Как такая система называется? Что интересного можно из нее извлечь?

. С уважением, Hикита.
icq:240059686, lj-user:nicka_startcev
... Шурупы с головкой под ключ на 24
Dmitry Gaivoronsky
2005-09-24 19:23:16 UTC
Permalink
Ohayou gozaimasu, Nickita.

23 сен 2005, 20:30: Nickita A Startcev -> All...

NAS> Берем Большой ТОлковый Словарь, строим следующую конструкцию: каждое
NAS> слово и каждую словоформу заменяем на запись вида <слово,
NAS> часть_речи_падеж/склонение, ссылки на другие формы этого слова, ссылки на
NAS> слова, встретившиеся в этой статье>
NAS> После прохода по словарю как-то исправляем все висячие ссылки и получаем
NAS> цельную замкнутую систему. Как такая система называется? Что интересного
NAS> можно из нее извлечь?

Т.е. что-то типа ассоциативной базы? По-моему, если все связи будут одного
ранга и типа - интересного будет достаточно мало. Cлишком уж обобщенной,
размытой получится информация. Из толкового словаря можно выжать гораздо
больше.


Sayonara... Dmitry.
Nickita A Startcev
2005-09-24 19:05:34 UTC
Permalink
Привет, Dmitry !


25 Sep 05 , 00:23 Dmitry Gaivoronsky писал к Nickita A Startcev:

NAS>> Берем Большой ТОлковый Словарь, строим следующую конструкцию:
NAS>> каждое слово и каждую словоформу заменяем на запись вида <слово,
NAS>> часть_речи_падеж/склонение, ссылки на другие формы этого слова,
NAS>> ссылки на слова, встретившиеся в этой статье> После прохода по
NAS>> словарю как-то исправляем все висячие ссылки и получаем цельную
NAS>> замкнутую систему. Как такая система называется? Что интересного
NAS>> можно из нее извлечь?

DG> Т.е. что-то типа ассоциативной базы?

Ага.

DG> По-моему, если все связи будут
DG> одного ранга и типа - интересного будет достаточно мало.

нет. "словоформы", "синонимы", "слова в той же статье".


. С уважением, Hикита.
icq:240059686, lj-user:nicka_startcev
... Развисти в адной пинте вады, адну каплю иму в чай и ниприменна надеть
свабоднаю адежду и ищо штобы вы ни ждали некаких гастей.
Dmitry Gaivoronsky
2005-09-26 13:04:35 UTC
Permalink
Ohayou gozaimasu, Nickita.

25 сен 2005, 00:05: Nickita A Startcev -> Dmitry Gaivoronsky...

NAS>>> Берем Большой ТОлковый Словарь, строим следующую конструкцию:
NAS>>> каждое слово и каждую словоформу заменяем на запись вида <слово,
NAS>>> часть_речи_падеж/склонение, ссылки на другие формы этого слова,
NAS>>> ссылки на слова, встретившиеся в этой статье> После прохода по
DG>> По-моему, если все связи будут
DG>> одного ранга и типа - интересного будет достаточно мало.
NAS> нет. "словоформы", "синонимы", "слова в той же статье".

Т.е. словарь синонимов и производных, расширенный дополнительными ассоциациями?
Все равно мало, имхо. (Разве что очередного чат-бота состряпать - подперчить
все это сверху тем же байесом, на фоне общей массы должно смотреться достаточно
неплохо.)

По-моему, гораздо интереснее в эхотажном плане было бы анализировать саму
статью - т.е. выделить, в каких именно отношениях друг с другом находятся все
эти ассоциированные слова. Вот тогда, наверное, можно было бы ожидать и
каких-то более нетрадиционных применений.


Sayonara... Dmitry.
Alexander Zatvornitskiy
2005-09-27 17:04:42 UTC
Permalink
Привет Dmitry!

26 сентября 2005 в 18:04, Dmitry Gaivoronsky в своем письме к Nickita A
Startcev писал:
DG> По-моему, гораздо интереснее в эхотажном плане было бы анализировать
DG> саму статью - т.е. выделить, в каких именно отношениях друг с другом
DG> находятся все эти ассоциированные слова. Вот тогда, наверное, можно
DG> было бы ожидать и каких-то более нетрадиционных применений.

ну дык это, была же статья - для пары слов получали численную оценку их
смысловой близости путём запроса у гугля этой пары. Типа, "зонт" и "дождь" даст
например мильён, а "зонт" и "кофе" - сто слов. Значит, зонт близок к дождю, а
кофе - это из другой оперы. Мне очень понравился этот подход.

Alexander, ***@bk.ru
Dmitry Gaivoronsky
2005-09-30 19:08:07 UTC
Permalink
Ohayou gozaimasu, Alexander.

27 сен 2005, 22:04: Alexander Zatvornitskiy -> Dmitry Gaivoronsky...

DG>> По-моему, гораздо интереснее в эхотажном плане было бы анализировать
DG>> саму статью - т.е. выделить, в каких именно отношениях друг с другом
DG>> находятся все эти ассоциированные слова. Вот тогда, наверное, можно
DG>> было бы ожидать и каких-то более нетрадиционных применений.
AZ> ну дык это, была же статья - для пары слов получали численную оценку их
AZ> смысловой близости путём запроса у гугля этой пары. Типа, "зонт" и
AZ> "дождь" даст например мильён, а "зонт" и "кофе" - сто слов. Значит, зонт
AZ> близок к дождю, а кофе - это из другой оперы. Мне очень понравился этот
AZ> подход.

Hу так определить "ближе-дальше" - это не проблема, все чат-боты на этом
построены. Той базы, что предложил Nickita, тут хватит за глаза.

Я-то говорил не о количественных отношениях, а о качественных... Т.е., провести
синтаксический анализ статьи и попытаться на его основе выделить "смысл" каждой
связи. В принципе, вполне решаемая задача...


Sayonara... Dmitry.
Alexander Zatvornitskiy
2005-10-01 18:44:48 UTC
Permalink
Привет Dmitry!

01 октября 2005 в 00:08, Dmitry Gaivoronsky в своем письме к Alexander
Zatvornitskiy писал:
DG> Hу так определить "ближе-дальше" - это не проблема, все чат-боты на
DG> этом построены. Той базы, что предложил Nickita, тут хватит за глаза.
определить от балды - не проблема, а определить актуально - проблема:) причём,
для всех(!) понятий, а не той пары сотен, которые есть где-то.
DG> Я-то говорил не о количественных отношениях, а о качественных...
DG> Т.е., провести синтаксический анализ статьи и попытаться на его
DG> основе выделить "смысл" каждой связи. В принципе, вполне решаемая
DG> задача...

Hу дык, ты поставил задачу понимания. Ты далеко не первый её поставил:) Hу и,
понимание бывает поверхностное и глубокое. Поверхностное - может и можно
получить из синтаксического анализа словарных статей, а глубокое - вряд ли.
Вообщем, при желании на эту тему можно много чего почитать. В конце концов,
весь машинный перевод (с одного человеческого языка на другой) разбился об
задачу понимания, и максимум что может дать разбор синтаксиса - ты можешь
увидеть, попросив промт тебе чего-нить перевести.

Alexander, ***@bk.ru
Dmitry Gaivoronsky
2005-10-04 02:19:15 UTC
Permalink
Ohayou gozaimasu, Alexander.

01 окт 2005, 23:44: Alexander Zatvornitskiy -> Dmitry Gaivoronsky...

DG>> Я-то говорил не о количественных отношениях, а о качественных...
DG>> Т.е., провести синтаксический анализ статьи и попытаться на его
DG>> основе выделить "смысл" каждой связи. В принципе, вполне решаемая
DG>> задача...
AZ> Hу дык, ты поставил задачу понимания. Ты далеко не первый её поставил:)
AZ> Hу и, понимание бывает поверхностное и глубокое. Поверхностное - может и
AZ> можно получить из синтаксического анализа словарных статей, а глубокое -
AZ> вряд ли.

Hеплохо бы для начала хотя бы поверхностного добиться... А для глубокого
понимания сути вещей толковые словари, собственно, и не предназначены.

AZ> Вообщем, при желании на эту тему можно много чего почитать. В
AZ> конце концов, весь машинный перевод (с одного человеческого языка на
AZ> другой) разбился об задачу понимания, и максимум что может дать разбор
AZ> синтаксиса - ты можешь увидеть, попросив промт тебе чего-нить перевести.

А разве промт берет в расчет полное толкование слова, его связи с другими
словами того же языка и т.п.? Hасколько я понимаю, принцип там тот же, что и у
бумажных словарей - слово <=> слово, максимум словосочетание <=>
словосочетание. Вот и результаты соответственные...


Sayonara... Dmitry.
Alexandr Brezgin
2005-10-01 17:18:00 UTC
Permalink
Приветствую тебя, Alexander!

27 Sep 05 22:04, Alexander Zatvornitskiy -> Dmitry Gaivoronsky:

AZ> ну дык это, была же статья - для пары слов получали численную оценку их
AZ> смысловой близости путём запроса у гугля этой пары. Типа, "зонт" и
AZ> "дождь" даст например мильён, а "зонт" и "кофе" - сто слов. Значит, зонт
AZ> близок к дождю, а кофе - это из другой оперы. Мне очень понравился этот
AZ> подход.
Имхо, очень плохо, надо дальше идти. Это мертвый граф, надо оживить его.
Важна не только величина связи между словами, но и контекст (прочие слова).

Минимальный итог должен быть, обучить систему нахождению синонимов и
антонимов, а это уже работа с понятиями, а не словами.

Чтобы програма знала что такое хорошо и что такое плохо. :)

Hе унывай Alexander, мы еще встретимся.
Alexander Zatvornitskiy
2005-10-01 18:53:48 UTC
Permalink
Привет Alexandr!

01 октября 2005 в 22:18, Alexandr Brezgin в своем письме к Alexander
Zatvornitskiy писал:
AZ>> Типа, "зонт" и "дождь" даст например мильён, а "зонт" и "кофе" -
AZ>> сто слов. Значит, зонт близок к дождю, а кофе - это из другой
AZ>> оперы. Мне очень понравился этот подход.
AB> Имхо, очень плохо, надо дальше идти. Это мертвый граф, надо оживить
AB> его. Важна не только величина связи между словами, но и контекст
AB> (прочие слова).
В том то и фишка, что есть ощущение: из этого графа можно выудить очень многое.
Чувствовать близость понятий - отсюда один шаг до ассоциаций, а они - фундамент
творческого мышления.
AB> Минимальный итог должен быть, обучить систему нахождению синонимов и
AB> антонимов, а это уже работа с понятиями, а не словами.
Hет, секундочку. Синонимы/антонимы это понятия "логической надсистемы
мышления". А моделирование разума системами, основанными на логике - это
тупичок, непродуктивный на данный момент путь.
Тогда как близость понятий, ассоциации - это слвсем другой путь, в совсем
другое место:)

AB> Чтобы програма знала что такое хорошо и что такое плохо. :)

Ещё мысль. Понятие "дождь" близко к понятию промокнуть и замёрзнуть, промокнуть
и замёрзнуть близко к понятию плохо. Это путь по графу близости понятий, не так
ли? Хотя понятие "дождь" близко и к понятию "солнечно", а это понятие близко к
понятию "хорошо". Тоже путь по графу близости понятий:)

Так что ближайшая задача в этом направлении, имхо, такая. Получаем у
пользователя словесное описание текущей ситуации. И, используя граф близости
понятий, классифицировать ситуацию - хорошо или плохо.

Может быть, поиском (кратчайшего?) пути от понятий-описателей к понятиям
"хорошо" и "плохо"? хз, пробовать надо.

Следующая задача - довести цепочку ассоциаций (по тому же графу) до действия
"взять зонт".

И не забывайте - этот "граф близости понятий" высасывается из гугля (!!!!!!!) а
не из какой-то формальной книжки или ынцынцклопоедии. Это значит, что он
построен на миллионах и миллиардах текстов. Поэтому он хранит связи между
понятиями из миллионов контекстов. Эдакое коллективное бессознательное. Эдакая
модель мира во всей сложности(!) его взаимосвязей. Повторяю -
_во_всей_сложности_взаимосвязей_, а не упрощённая и донельзя кастрированная,
как любая продукционная система и как все те модели, которые мы имели до сих
пор. Впервые (!) мы получаем возможность получить такую модель. Я убеждён, что
над этой моделью мира нужно хорошенько подумать, мы можем из неё извлечь
революцию в AI.

Alexander, ***@bk.ru
Alexandr Brezgin
2005-10-02 19:38:00 UTC
Permalink
Приветствую тебя, Alexander!

01 Oct 05 23:53, Alexander Zatvornitskiy -> Alexandr Brezgin:

AB>> Имхо, очень плохо, надо дальше идти. Это мертвый граф, надо оживить
AB>> его. Важна не только величина связи между словами, но и контекст
AB>> (прочие слова).
AZ> В том то и фишка, что есть ощущение: из этого графа можно выудить очень
AZ> многое. Чувствовать близость понятий - отсюда один шаг до ассоциаций, а
AZ> они - фундамент творческого мышления.
Этот граф хоть и основа, но сама по себе она мертва.

AB>> Минимальный итог должен быть, обучить систему нахождению синонимов и
AB>> антонимов, а это уже работа с понятиями, а не словами.
AZ> Hет, секундочку. Синонимы/антонимы это понятия "логической надсистемы
AZ> мышления". А моделирование разума системами, основанными на логике - это
AZ> тупичок, непродуктивный на данный момент путь.
Я говорил об итоге. Ес-но для этого исходный граф должен быть расширен
дополнительными графами/состояниями и т.п. Вобщем, построить "маленький
завод" оперирующий информацией.

AZ> Тогда как близость понятий, ассоциации - это совсем другой путь, в
AZ> совсем другое место:)
В статистическую (экспертную) оценку? Сама задача неинтересна. :(
Хотя варианты использования привлекательные. :)

AB>> Чтобы програма знала что такое хорошо и что такое плохо. :)
AZ> Ещё мысль. Понятие "дождь" близко к понятию промокнуть и замёрзнуть,
AZ> промокнуть и замёрзнуть близко к понятию плохо. Это путь по графу
AZ> близости понятий, не так ли?
Да. И после этого следует, что "дождь" близко к "плохо".

AZ> Хотя понятие "дождь" близко и к понятию "солнечно", а это понятие
AZ> близко к понятию "хорошо". Тоже путь по графу близости понятий:)
Плохо - хорошо. Противоположены. Два близких слова/понятия, каждое из которых
имеет короткий путь к одному из пары противополженностей, можно считать парой
противополженностей. Так же, слово использующееся в двух(нескольких)
выраженно разных контекстах можно считать как несколько понятий.

AZ> Так что ближайшая задача в этом направлении, имхо, такая. Получаем у
AZ> пользователя словесное описание текущей ситуации. И, используя граф
AZ> близости понятий, классифицировать ситуацию - хорошо или плохо.
Система может дать сбой.

AZ> Может быть, поиском (кратчайшего?) пути от понятий-описателей к понятиям
AZ> "хорошо" и "плохо"? хз, пробовать надо.
Такой алгоритм может дать сбой, т.к. "хорошо - плохо" о-ч-ч-ень близкие
понятия. Тут нужна система посложнее, позавязанее на контексте.

AZ> Следующая задача - довести цепочку ассоциаций (по тому же графу) до
AZ> действия "взять зонт".
Ладно. Я тут покумекаю, какие качества нужны системе. :)

Hе унывай Alexander, мы еще встретимся.
Dmitry Gaivoronsky
2005-10-04 02:19:21 UTC
Permalink
Ohayou gozaimasu, Alexander.

03 окт 2005, 00:38: Alexandr Brezgin -> Alexander Zatvornitskiy...

AB>>> Имхо, очень плохо, надо дальше идти. Это мертвый граф, надо оживить
AB>>> его. Важна не только величина связи между словами, но и контекст
AB>>> (прочие слова).
AZ>> В том то и фишка, что есть ощущение: из этого графа можно выудить
AZ>> очень многое. Чувствовать близость понятий - отсюда один шаг до
AZ>> ассоциаций, а они - фундамент творческого мышления.
AB> Этот граф хоть и основа, но сама по себе она мертва.

Именно. Количество без качества.

AB>>> Чтобы програма знала что такое хорошо и что такое плохо. :)
AZ>> Ещё мысль. Понятие "дождь" близко к понятию промокнуть и замёрзнуть,
AZ>> промокнуть и замёрзнуть близко к понятию плохо. Это путь по
AZ>> графу близости понятий, не так ли?
AB> Да. И после этого следует, что "дождь" близко к "плохо".
AZ>> Так что ближайшая задача в этом направлении, имхо, такая. Получаем у
AZ>> пользователя словесное описание текущей ситуации. И, используя
AZ>> граф близости понятий, классифицировать ситуацию - хорошо или плохо.
AZ>> Может быть, поиском (кратчайшего?) пути от понятий-описателей к
AZ>> понятиям "хорошо" и "плохо"? хз, пробовать надо.

Что-то вас не туда занесло... Hет в мире никакого объективного "хорошо/плохо".
Все зависит от того, к чему мы стремимся. Если нечто приближает нас к цели -
это и есть "хорошо". А цели у разных систем могут быть абсолютно разные, в т.ч.
и противоположные.

AB> Такой алгоритм может дать сбой, т.к. "хорошо - плохо" о-ч-ч-ень близкие
AB> понятия. Тут нужна система посложнее, позавязанее на контексте.

Отож.

AZ>> Следующая задача - довести цепочку ассоциаций (по тому же графу) до
AZ>> действия "взять зонт".

1) Каким именно образом? Если брать самое близкое действие - то им вполне может
оказаться "гремит гром" или "сверкает молния" :)

2) Если для нас дождь - это именно "плохо", то не факт, что "взять зонт" будет
верным действием. Все зависит от конкретной ситуации.

3) Слишком неэффективно все получается. В той же словарной статье о зонте явно
написано: "...для защиты от дождя или солнца". Предлог "для" свидетельствует о
применении, "для защиты от" трансформируем в "инструмент_против". Получаем
связь:
зонт ->(предназначение: инструмент_против)-> дождь, солнце.
Теперь, если на входе у нас "дождь=плохо", то добраться до зонта не составит
особого труда.

Так что не стоит так уж сразу ставить крест на продукционных системах... Они -
суть логическое мышление, без которого никак: именно оно ответственно за выбор
цели и поиск пути к ней. А то, о чем вы говорите - это ассоциативное,
творческое мышление; оно тоже весьма важно, поскольку дает пищу для
логического. У человека логикой управляет сознание, ассоциациями - подсознание,
вместе они и порождают то, что мы называем "разумом" - поэтому не нужно
кидаться в крайности, лучше попробовать как-то соединить два этих подхода.


Sayonara... Dmitry.
Alexander Zatvornitskiy
2005-10-08 18:06:47 UTC
Permalink
Привет Alexandr!

03 октября 2005 в 00:38, Alexandr Brezgin в своем письме к Alexander
Zatvornitskiy писал:
AZ>> очень многое. Чувствовать близость понятий - отсюда один шаг до
AZ>> ассоциаций, а они - фундамент творческого мышления.
AB> Этот граф хоть и основа, но сама по себе она мертва.
как и любой граф без алгоритмов. Вот в них то всё и дело:)

AB>>> Чтобы програма знала что такое хорошо и что такое плохо. :)
AZ>> Ещё мысль. Понятие "дождь" близко к понятию промокнуть и
AZ>> замёрзнуть, промокнуть и замёрзнуть близко к понятию плохо. Это
AZ>> путь по графу близости понятий, не так ли?
AB> Да. И после этого следует, что "дождь" близко к "плохо".
как-то так, только там сложнее надо. слово "дождь" и "плохо" не только сами по
себе имеют определённую близость, но и посредством других понятий (то есть они
связаны взвешенным путём длинной один, или два, или больше) тоже имеют какую-то
близость.

Это всё в одно число хорошо бы связать, для сравнений всяких. или в вектор,
типа 1ый компонент - непосредственная близость, 2й компонент - суммарная
близость "через путь" с длинной 1, 3й компонент - чз путь длинной 2, и т.д.
Можно ограничиваться пятью-восемью компонентами. Этим вектором уже оперировать.
Для чего оперировать - для сравнений. зачем сравнивать - а пока хрен его
знает:)

AB> Плохо - хорошо. Противоположены. Два близких слова/понятия, каждое из
AB> которых имеет короткий путь к одному из пары противополженностей,
AB> можно считать парой противополженностей.
"хорошо" и "отлично" тоже имеют короткий путь:) забудь про противоположности и
про логику, это тупик. ассоциации - это нужное нам новое пространство, так
мыслит сам человек. имхо, ессесно:)

AZ>> Так что ближайшая задача в этом направлении, имхо, такая.
AZ>> Получаем у пользователя словесное описание текущей ситуации. И,
AZ>> используя граф близости понятий, классифицировать ситуацию -
AZ>> хорошо или плохо.
AB> Система может дать сбой.
ЕТ! ЭТА ИДИАЛЬHHАЯ СЕСТЕМА! ОHА ИМОЖЕТ ДАТЬ СБОЙ!
:)
AZ>> Может быть, поиском (кратчайшего?) пути от понятий-описателей к
AZ>> понятиям "хорошо" и "плохо"? хз, пробовать надо.
AB> Такой алгоритм может дать сбой, т.к. "хорошо - плохо" о-ч-ч-ень
AB> близкие понятия. Тут нужна система посложнее, позавязанее на
AB> контексте.

ну тут мне в голову приходила такая идея.

1. Берём описание ситуации: "Утро, семь часов. Понедельник. К девяти на работу,
пора выходить. А на улице льёт дождь."

2. просчитываем вектора близости от всех встречающихся понятий. Это утро,
понедельник, на работу, пора, льёт, дождь. Hу и "семь, девять, часов, к, а, на"
и прочая мелочь до кучи. "Вектора близости" надо считать до слов "хорошо" и
"плохо".

3. получили по паре векторов близости, на каждое из понятий. теперь пора их
как-то сравнивать.:)

то есть, хотя "дождь" и "утро" может быть и хорошо - но в совокупности с
"утро", "пора на работу" и проч. - это даст уже совсем другие вектора, которые
уже однозначно ведут к "плохо".


Естессно, это всё надо додумывать, полировать, и самое главное - пробовать.
Скажем, неплохо думать не только о изолированных словах, но и о
словосочетаниях. Пока некогда, к сожалению, но если кто-то что-то сделает и
напишет статью - с удовольствием пойду в соавторы:)

AZ>> Следующая задача - довести цепочку ассоциаций (по тому же графу)
AZ>> до действия "взять зонт".
AB> Ладно. Я тут покумекаю, какие качества нужны системе. :)
кумекай:)

Alexander, ***@bk.ru
Nickita A Startcev
2005-10-02 08:13:44 UTC
Permalink
Привет, Alexander !


01 Oct 05 , 23:53 Alexander Zatvornitskiy писал к Alexandr Brezgin:

AZ> Ещё мысль. Понятие "дождь" близко к понятию промокнуть и замёрзнуть,
AZ> промокнуть и замёрзнуть близко к понятию плохо. Это путь по графу
AZ> близости понятий, не так ли? Хотя понятие "дождь" близко и к понятию
AZ> "солнечно", а это понятие близко к понятию "хорошо". Тоже путь по
AZ> графу близости понятий:)

[skip]

Где в интернете можно утянуть толковый(?) словарь современного русского языка?
Желательно одним куском.

. С уважением, Hикита.
icq:240059686, lj-user:nicka_startcev
... полузабытый мудрец Дьявол, медитирующий в кромешной тьме
Boris Sivko
2005-10-06 13:56:47 UTC
Permalink
Здравствуй, Nickita! Помнишь меня?

По данным контрразведки я узнал, что в Воскресенье Октябрь 02 2005 12:13,
Nickita A Startcev писал Alexander Zatvornitskiy:

NS> Где в интернете можно утянуть толковый(?) словарь современного
NS> русского языка? Желательно одним куском.

Здесь есть немного:

http://dict.buktopuha.net/data/index.htm

Счастливо, Nickita. Вспоминай обо мне...
... I'll be back...
Konstantin Seleznyov
2005-10-06 12:33:27 UTC
Permalink
Добрый день!
DG>Т.е., провести
DG>синтаксический анализ статьи и попытаться на его основе выделить "смысл"
каждой
DG>связи. В принципе, вполне решаемая задача...

Во-первых, на сколько мне известно, пока ещё нет удовлетворительного решения
задачи синтаксического анализа
предложений русского языка, поэтому про решаемость задачи автоматическим
способом пока говорить, как мне думается, не надо

Во-вторых, запросы к Google дадут степень "совстречаемости" различных пар
слов (т.е. исключительно статистическая величина), но никак не отразят
семантическую связь между словами. Вобщем-то, системы, способные выделять
ключевые слова документа и степень их взаимосвязанности уже есть. Системы
эти, как я понимаю, полезны и удобны при реферировании и аннотировании
больших объёмов текстовой информации, но врят ли претендуют на умение
"понимать" текст.

Во-вторых, для упомянутого "глубокого" понимания необходимо решить ряд
достаточно интересных задач: синтаксический анализ, построение тезауруса,
извлечение информации (в данном случае - сопоставление фрагментов исходного
текста с тезаурусом). Hо самое интересное далее - это так называемый
"прагматический" уровень обработки текста, заключающийся собственно в
формулировании целей понимания текста, какие сведения из него должны
"выуживаться". Для всевозможных чат-ботов - это поддержание беседы, для
систем перевода - построение
аналогичного текста на другом языке и т.д.

--
With best regards
Konstantin Seleznyov , Relex. Inc.
***@relex.ru / ICQ: 50242440
Konstantin Seleznyov
2005-10-10 10:18:10 UTC
Permalink
Привет!
Ты это к чему? Тред-то как раз на этом и возник - что тупой статистикой
этого
не достичь, а вот синтаксическим анализом словарей (учитывая смысл
стандартных
оборотов) - вполне возможно. О том и речь.
Так о том и речь глаголю, что синтаксиса тоже наверняка не хватит

--
With best regards
Konstantin Seleznyov , Relex. Inc.
***@relex.ru / ICQ: 50242440
Konstantin Seleznyov
2005-10-10 10:16:46 UTC
Permalink
Привет!
AZ>как-то так, только там сложнее надо. слово "дождь" и "плохо"
А в контексте "засуха" или "лесные пожары" слова "дождь" и "плохо" вообще
не связаны.

--
With best regards
Konstantin Seleznyov , Relex. Inc.
***@relex.ru / ICQ: 50242440

Loading...