Отзывы

From: "Intellectual Partner" intelpart@tut.by
Subject: Re: 
To: "Yurij Lotoshko" lotoshko@yahoo.com 
Date: Mon, 08 Sep 2003 13:47:29 +0300 

Добрый день, уважаемый Юрий Ростиславович!

Извините за очень долгую задержку с ответом на Ваше письмо: почти все 
лето вынужден был решать ряд личных проблем, и было просто не до того.

Теперь о Вашей рецензии.

Мы с большим интересом прочитали Ваши замечания и соображения по 
поводу нашего выступления на "Диалоге-2003". Нас порадовали Ваши 
четкие и обоснованные комментарии. Это говорит о том, что cкорее всего 
мы с Вами решаем где-то аналогичные проблемы и движемся в одном 
направлении.

1)
> Ну, слава богу, наконец-то через пять лет читаю что-то как-то
> частично повторяющее некоторые принципы программы "Кондор".

То, что изложено в нашем докладе - это пересказ первой части книги 
"Многоконтекстная обработка больших объемов информации", которая была 
издана в Праге в 2000 году. Ну а отработка принципов на программных 
продуктах, в том числе и коммерческих начата в 1992 году и 
продолжается по сей день.
Кстати, не могли бы Вы указать, где можно более подробно познакомиться 
с Вашей программой "Кондор"? Если это возможно.

Последний раз модифицировал "Kondor" в 1999 году. Но надоело постоянно "вручную" отслеживать информацию и пополнять БД  для анализа, поэтому переключился на проблему автоматического пополнения БД. Готовлю доклад по этой проблеме. Результаты анализа текста даны на этом сайте

Доклад по "Kondor"у был прочитан в Пущине. Ссылка на тезисы найдёте на этом сайте. В докладе давалось самое упрощенные принципы смыслового, информационного анализа текстов на чешском языке. Некоторые Know How, естественно, там не описаны. Но общие принципы там даны, но я боюсь, что они вам будут не совсем понятны, поскольку, как я понял просмотрев ваш сайт, мы идём параллельными путями. Насколько я понимаю, другого пути в смысловом анализе текста нет и не будет. Будут нюансы (вариации), своих нюансов я у вас пока не увидел. А вот проблемы, с которыми вам предстоит столкнуться вижу.

 
2)
> 1. По поводу "конечности отношений элементарных смыслов" - слишком
> смелое если не наивное утверждение. Авторам следует учитывать
> относительность этой "конечности", которая обусловлена знаниями
> человека/человечества в данном культурном ареале и в данное время.
> Если бы отношения были конечны, то не было бы открытий. Нарушение этой
> конечности свидетельствует либо о новом открытии (гениальности), либо
> о безумии, хотя, как утверждают некоторые психологи, - гениальность -
> это одна из разновидностей безумия. 

Возможно в сообщении мысль отражена не совсем четко, поэтому поясним,
что здесь имелось ввиду.

Мы определили "смысл" как "определенная устойчивая система отношений
данного слова с другими словами". 

При таком подходе вы учитываете только одну треть лексического значения слова, а именно структурный компонент на уровне парадигматики. Это ущзербная теория.

Так вот, мы утверждаем, что:
- Отношения данного слова с другими словами описывают элементарный
смысл слова. Элементарный в смысле - без учета контекстов, в этом его
элементарность.
- Отношения данного слова с другими словами выражаются с помощью 
отношений естественного языка и их конечное число.
- Структура, используемая для представления элементарного смысла, 
названа "модулем элементарного смысла" (более подробно см. здесь: 
http://mujweb.cz/www/context/belarus/dadatak-11.htm и 
http://mujweb.cz/www/context/belarus/dadatak-12.htm).

Это из "dodatak-11"

Разгледзім суб'ектава-арыентаваныя аналёгіі ў межах простага сказу натуралёвае мовы. Граматычная структура сказу натуралёвае мовы ў агульным выпадку (тут і далей пададзена канкрэтыка для беларускае мовы) зьмяшчае наступныя элемэнты [Ул.А.Карпаў, Мова як сыстэма. Менск: Вышэйшая школа, 1992]:

S -- суб'ект,
A -- дзеяньне,
O -- аб'ект,
Adr -- адрысат,
In -- інструмэнт,
Topic -- тэма,
Loc -- мейсца,
G -- прыналежнасьць,
Adv -- прыкмета дзеяньня,
Atr -- прыкмета прадмета,
Cause -- прычына,
Goal -- мэта,
Time -- час,
Condition -- умова,
Number -- лік,
Prep -- прыназоўнік,
Modal -- мадальнасьць ды інш.

По своей сути ваши "элементарные смыслы" - это семантические падежы в неполном списке. По поводу этого термина смотрите ниже.

Это из "dodatak-12"
Прыслоўі:
400 - прыслоўі колькасьці,
460 - прыслоўі часу,
470 - прыслоўі спосабу дзеяньня,
480 - прыслоўі кірунку,
490 - прыслоўі мейсца,
Пытальныя словы:
колькі? - 408;
калі? - 468;
як? - 478;
куды? - 488;
адкуль? - 498.

Другая лічба ў кодах службовых словаў разьдзяляе іх на:
910 - прыназоўнікі, якія ўжываюцца з родным склонам,
920 - прыназоўнікі, якія ўжываюцца з давальным склонам,
930 - прыназоўнікі, якія ўжываюцца зь вінавальным склонам,
940 - прыназоўнікі, якія ўжываюцца з творным склонам,
950 - прыназоўнікі, якія ўжываюцца зь месным склонам,
960 і 970 - злучнікі,
980 - выклічнікі.

Судя по этим данным, вы вручную проиндексировали грамматические показатели (в терминологии компонентного анализа - это категориально-грамматические семы). Но я не увидел ни дифференциальных, ни потенциальных семантических признаков - сути понятийного ядра лексического значения слова. Весьма интересно было бы посмотреть на ваши результаты смыслового анализа текста По своей сути вы пытаетесь определить "селективный" или структурный компонент значения слова (смотрите мою дипломную работу о субстантивном определении слова). По поводу терминологии - она еще не устоялась. Будьте осторожны с этим компонентом, поскольку вы уже, как сказано ниже, столкнулись с проблемой контекстного анализа. На уровне текста этот компонент действует несколько по-иному.

Безусловно, Вы правы, когда утверждаете, что отношений между модулями
элементарного смысла может быть бесконечное множество. Так оно и есть.
Но мы пока говорим не об этом. Мы говорим о том, что для того, чтобы
представить элементарный смысл слова, не нужно брать все отношения;
достаточно взять конечное число наиболее повторяющихся отношений этого
слова с другими словами. В простейшем случае эти отношения нам дает
грамматика. Далее

Если вы хотите решить эту проблему, то вам придётся обращаться к родо-видовым отношениям на уровне парадигматики, что вы практически и сделали, включая индексы (грамматические показатели). Для родовых отношений конечность обязательна, для видовых - конечность относительна (с учётом познаваемости мира).

Насколько я понимаю, вы пытаетесь построить "глобальную" систему смысла, это практически и теоретически невозможно, если мы имеем дело с "живым языком", некодифицированным, поскольку на уровне носителя языка смысл слова (нехороший термин) будет все время индивидуален. Для русского языка система прадигматических отношений даётся в "Учебном словаре сочетаемости слов русского языка". Если вы осилите эту проблему, то там будут большие перспективы в сфере "компьютерно-лингвистического" перевода текста и дальнейшего развития общения с ЭВМ на уровне естественного языка.

Моя же задача более утилитарна - оценить информационное содержание текста, то есть сказать пользователю стоит читать этот текст или нет.


> 4. Ограниченность структуры и формализация - с этим можно спорить и
> это является наиболее слабым местом в предлагаемой концепции. Модуль
> должен быть саморазвивающимся, автоматически пополняющимся и
> приближаться к понятию искусственный интеллект (ИИ). Всё выполнимо.
> Думайте. 

Правильно! А для того, чтобы модуль элементарного смысла был 
саморазвивающимся одной грамматики, к сожалению, не достаточно. 
Поэтому модуль имеет не только, если можно так выразиться, 
"грамматические оси", но и "структурные", и "временные" ( 
http://mujweb.cz/www/context/belarus/dadatak-11.htm). Это необходимо
для встраивания модуля в картину мира и организации движения картины
мира во времени.

Это прекрасно! Посмотрел

Представление элементарного смысла в виде модуля - это лишь первый
шаг. Но смысл любого слова определяется не только системой устойчивых
отношений с другими словами. На смысл слова влияет контекст, т.е.,
цитирую, "знания человека/человечества в данном культурном ареале и в
данное время". Поэтому следующим шагом является построение модуля
элементарного смысла в контексте (более подробно см. здесь:
http://mujweb.cz/www/context/belarus/dadatak-21.htm).

Надо посмотреть, пока не залез на эту страничку. Потом дополню

Но как только мы начинаем работать с контекстом, тут же возникает
проблема: контекстов может быть бесконечное множество. Все их учесть
физически невозможно. Но с другой стороны все же необходимо иметь
возможность представлять модуль элементарного смысла в любом требуемом
в настоящий момент контексте. Эта проблема решена за счет построения
субъектно-ориентированной картины мира (более подробно см. здесь:
http://mujweb.cz/www/context/belarus/dadatak-22.htm).

Еще не смотрел, но посмотрю


Вот здесь вы захлёбываетесь в своей "глобальности". Не берите всё, берите только дифференциальные признаки,  дифференцирующие контексты. Структурный элемент лексического значения слова. Учитывайте закон семантической сочетаемости.

Но контексты, как и смысл слова, изменяются во времени. Следовательно,
построенная субъектно-ориентированная картина мира будет отражать
структуру отношений, соответствующую только определенному моменту
времени. Принципы организации движения картины мира во времени описаны
здесь: http://mujweb.cz/www/context/belarus/castka-3.htm .

Ну вы замахнулись! Утонете в глобальности. Я в дипломной работе описывал изменение трех слов на протяжении 8 веков. Так что о диахронии в языке представление имею. Оставьте эту проблему потомкам. Более интересно и более актуально заниматься синхронией - тем, что мы имеем сейчас, при этом даже на современном этапе подвижки в семантике слов происходят большие. Социальные факторы.

Принципы работы с категориальным контекстом описаны здесь: 
http://mujweb.cz/www/context/belarus/castka-4.htm .

Мы сознательно не стали полностью поднимать на "Диалоге" все эти 
вопросы, поскольку:
- формат 15-минутного выступления этого не предполагает,
- решили не пугать никого и доложить только самый простой и очевидный
фрагмент.

Пора пугать. Стараюсь следить за работой Диалога с 1998 г. Если посмотреть авторов публикаций, то межсобойчик получается. Кукушка хвалит петуха, за то, что хваллит он кукушку. Стогнация.  Загляните на сайт Диалога, уже принимают доклады на Диалог-2004.

3)
> 2. По поводу семантических падежей - этот термин заимствован из
> импортной лингвистики, в которой языки не флективные, поэтому
> смешивать в одну кучу дифференциальные и категориальные. семантические
> признаки во флективных языках (языки, в которых развита система
> окончаний) - нонсенс. Оставим в стороне тюркские, арабские и
> восточные (иероглифы) языки.

Можем дать ссылку. Термин взят из книги "Будущее искусственного
интеллекта", М: Наука 1991, стр. 61. И взят единственно для "Диалога".
Мы в своей работе используем понятия "роль", "ролевая структура
предложения" и т.п. Нам кажется, что этот термин более четко отражает
суть.

Термин "семантические падежи"  старый и не лучший. Более приемлемая терминология для явлений, которые вы описываете даётся Гаком. Для русского языкознания термин падеж связан со словоизменением, морфологией, но не с семантикой. Роль и ролевая структура предложения - это, кажется, вы в прагматику полезли или в семантический синтаксис. Случайно не из формальной грамматики чешского языка. Третий том их грамматики (Skladba) очень сильная вещь. Правда там даётся ZVS (zakladni vetna struktura). В этой структуре сочетается и морфология, и семантика, и синтаксис. Прекрасная вещь для дальнейшего развития настоящей компьютерной лингвитсики.


4)
> 5. Очень жаль, что незнаком с работами профессора В.А.Карпова.
> Возможно, что, работая в области компьютерной морфологии, я повторяю
> пройденный маршрут. 

Второе издание книги профессора В.А.Карпова "Язык как система" должна 
вот-вот выйти в Москве. Правда, совершенно не знаем, в каком 
издательстве и каким тиражом.
Если узнаете, сообщите, интересно всё-таки взглянуть. Минская лингвистическая школа весьма интересна, более логична. Хотя, даже судя по вашему сайту, В.А.Карпов в большей мере структуралист. Идеи Хомского прослеживаются.

Спасибо.

С уважением,
С.Александров

INTELLECTUAL PARTNER, Ltd.
P.O.Box 158, 220012 Miensk-12, Belarus
E-mail: intelpart@tut.by
Http://mujweb.cz/www/intelpart
Http://mujweb.cz/www/context
Http://mujweb.cz/www/padrucnik

Реклама на сайте

Заранее приношу извинение за содержание рекламы, которую предоставляет поставщик рекламы,
но не до жиру быть бы живу

Каждый Ваш клик (не менее трёх) на рекламных ссылках позволит мне заработать от 0.5 до 5 центов.
Может зубы вставлю.

Грёбаная страна, раз опускаешься до такого. Ну каковы правители, таковы и порядки. Пиздят об одном, в реальности - другое. Далеки они от народа (дальше, чем декабристы).

Единственное БЛАГО, что за такие сайты пока ещё не сажают (прогресс коммуникации), но читают.

Кликни - не будь жлобОм или жлОбом,
безработному дОценту (не путать с прОоцентом) кушать хочется, правда, сначала зубы вставить надо, шамкать нечем.


Ремонт квартир и офисов, отделка, перепланировка, реконструкция, строительство. Быстро, качественно, недорого. Премии посредникам



 VA-bank - для игроков в азартные игры



Портативная техника от A до Z. Доставка в любой город России и Белоруссии

DIGITA.ru: LCD-экраны, телевизоры, магнитолы, музыкальные центры, проекционные телевизоры... Hi-End аппаратура. VIP-обслуживание

eServer.ru :: Хостинг-провайдер №1

Agava.ru

PORTA.RU
MP3 плейеры
MD плейеры
CD плейеры
Радио
Диктофоны

Фотоаппараты
Видеокамеры

Сотовые трубки
Радиотелефоны

Ноутбуки
Карманные ПК
Переводчики

Если у Вас есть, что рекламировать, то Вам поможет в этом


А это, если хотите стать рефералами и зарабатывать деньги в сети


поставщик рекламы на Ваш сайт

Партнерская программа RMF: 0,05$ за клик, 0,01$ за popup, 500$ с заказа, 10% от заработка рефералов. Регистрация »»

Британская фирма cashculture

Нажми здесь, sendmoreinfo
Нажми здесь

Нажми здесь, Nocs
Нажми здесь

LeadExchanger
Нажми здесь

Centmails
Нажми здесь

KLAMM -ЖМИ!
Нажми здесь

Нажми здесь, spedia
Нажми здесь

E-mailPaysU
Нажми, зарегистрируйся и ты получишь 10$

Если Вы хотите что-то рекламировать и получать за это, то вам поможет в этом

Маргинал Лотошко ищет работу

О себе и сайте Список моих публикаций

Искусственный интеллект

Компьютерная лингвистика. Компьютерная морфология

Разное

Слоговая система языка Компьютерная семантика. Некоторые законы инфосферы Методичка по чешскому языку Диалектология, Тематический диалектный словарь Мои ссылки в Интернете
Отзывы и замечания Список zip-файлов, выложенных на сайте "Картинки" из недр Интернета и мои фотографии Сменные "нежданчики" Для "постоянных" посетителей
Некоторые кулинарные рецепты для рыб-гурманов Корпусная лингвистика
("А был ли мальчик?")
Диалог 2004 Постоянные "нежданчики" Литературный уголок
Горячие новости "Закон Мёрфи" и под. О бедном Володе замолвите слово Credo Для тех, кто ищет работу

Copyright © 2003 Лотошко Ю.Р. (Lotoshko Yu.R.)
Пишите Lotoshko Yu.R.
ICQ: 303397642 Последние изменения - 09.05.2004 19:19

Проверить аттестат

Hosted by uCoz