Усложнение описаний

Думаю, как можно усложнить текст. Вот у меня сейчас есть вариант: герой узнал нужную ему информацию из книги (фильма, передачи, газеты, разговора). Звучит коряво, поэтому добавляю вариант – читает книгу. Но это тоже неинтересно. Надо подробнее. Но как? Перебрать все синонимы? Не то. Сколько вообще может быть вариантов описания, как герой читал книгу? А ведь интересны не стандартные описания – «он открыл книгу и прочитал», а что-то оригинальное. Или заставить программу искать по всем текстам слово «книга», чтобы программа собирала варианты, что герои с книгой делают? Попахивает плагиатом...

Тогда как же?

Еще один вариант - сделать таблицу, что есть у книги и у читателя, и пусть добавит произвольно пару-тройку этих слов - страницы, шелестит, строчки, буквы, переплет, рвет, листает...  Но это что, для каждого слова такие ассоциации? Это ж дохренища таблиц...

18:51
110




19:39
Сколько вообще может быть вариантов описания, как герой читал книгу? А ведь интересны не стандартные описания – «он открыл книгу и прочитал», а что-то оригинальное


— Книга читала героя. То есть, конечно, читал книгу он, но блок страниц с корешком отвечал взаимностью. Это была не настолько строптивая книга, с которой можно было пройти целый цикл семейной жизни — от сладкого предвкушения теплой любви и домашнего уюта до ревности, ссор, упреков и битья тарелок, а, в иных случаях, даже развода и полного разрыва отношений… Эта книга (вариант — название книги), как верная спутница жизни, дала ему нужный совет (вот тут уже нужны варианты соответствующих выражений)…

— На глаза попалась такая-то книга…

— Герой почерпнул нужную информацию из Большого Энциклопедического словаря…

— Вооружившись сведениями из Медицинской энциклопедии (герой, очевидно, нашел у себя уйму заболеваний)…

— А вот и впечатления туристов о Темной стране. Какие интересные традиции, культура, богатая архитектура… Культ жертвоприношений — удивителен. Стоп! (Герой перечитывает указанную страницу, или возвращается к просмотренной, делая для себя выводы).

От себя скажу, что я не люблю сцены, где герою очень удобно попадается нужная инфа в случайно открытой книге. У себя в романе я такой момент разбила на две сцены, с промежутком в неделю, и то потом оказалось…
Герой почерпнул нужную информацию из Большого Энциклопедического словаря…
— но уронил черпак вместе с информацией, и черпак утонул в словаре.

Вооружившись сведениями из Медицинской энциклопедии
герой пошел на дракона
Сейчас больше склоняюсь к ассоциациям. Хотя бы чтобы программа ПОНИМАЛА. Не тупо драла из чужих текстов, а понимала. Книга. Ассоциации (специальная таблица) — корешок, страницы, закладка, библиотека… Что они умеют делать? выпала закладка, стояла библиотека… Какие они бывают? (еще одна таблица) — старая библиотека, красный корешок, пожелтевшие страницы, свежие страницы… заплесневелые страницы… Вот хотя бы так. Ищет, где то, что ему надо. Читает книгу. стоит старая библиотека. Шуршат заплесневелые страницы. Чернеют аккуратные буквы. Вот уже хоть что-то…
Но это примитивно, да. А чтобы было интересно, как в твоих примерах, надо еще работать и работать…
И это ж сколько таблиц ассоциаций будет… А без них никак. На этом все мышление. Книга — ассоциация — страница, страница шелестит… а что еще где в какой таблице умеет шелестеть? А вот, листья. Ура, программа догадалась — страница шелестит как опавший лист
21:13
А словарь Даля глянь. Тоже, ведь, слова подаются через гнездо (а не только по алфавиту). Вот тебе приблизительный план таблиц.
21:14
И это ж сколько таблиц ассоциаций будет

Таблиц или строк в таблице?
Таблиц. Строк вроде одна. Таблица «книга», а в ней слова — страница, буква, слово, переплет. Таблица — телевизор, а в ней слова — рябь, каналы, пульт, экран, соловьев, дом-2. Или есть у меня одна большая таблица существительных, и туда можно добавить столбец, где индексы, что к чему относится? Но индексов будет много… та ж рябь относится к телевизору, к реке… река — к природе и к городу, и к средствам передвижения (по реке можно плыть), и.т.д…
09:02
Так, а в чем смысл такой структуры — по таблице на слово?
Нужно, чтобы с каждым словом у программы была куча ассоциаций. Как у человека в мозгу. С каждым словом куча ассоциаций. Как это сделать в одной таблице?
09:36 (отредактировано)
Внутри таблицы сделать столбцы. Скажем, столбец на определения, на существительные и т.д. после чего в ячейки вносить массивы этих определений. Я тебе показывала такие массивы.

Тогда получится по строке на слово.
У меня уже в таблице одни существительные. Но между этими существительными должны быть сложнейшие связи. И как их сделать? Рядом с существительным столбец — ассоциация 1, ассоциация 2? Например, у «рыба» — ассоциация 1 — вода, 2 — еда, 3 — домино… И сколько таких столбцов будет?
09:52 (отредактировано)
Ну, у меня разные мысли есть, как такие связи построить, но насколько это будет нормально на практике, тут вопрос. В любом случае, список связей (по ид слов) должен быть. Опять же, создать массив в ячейке, и там прописывать ид других слов. Лучше отдельной таблицей. Может быть, это не так правильно, учитывая, что работать будет лишь в одну сторону, но с другой стороны, связать воду с домино сложно, а с рыбой легко. У рыбы же, помимо воды, будет связь с домино. Так и получится:

У воды ид 1, у рыбы 2, у домино 3.

Ид слова: | Связи:

1 | — 2

2 | — 1
… | — 3

Из-за дурацкой автозамены не получается набрать более внятно…
Вот-вот, то есть, рыбе отдельную таблицу, а не в общую таблицу существительных пихать?
09:58 (отредактировано)
Да не рыбе, а ВСЕМ словам отдельную ОБЩУЮ таблицу для связей. А можно и в самой таблице с ними сделать столбец. Просто отдельной удобнее, как мне кажется.
ИД строки | ИД слова | (тут можно само слово, чтобы пользователь понимал, о чем речь) | ИД слова, с которым связано первое слово | ИД еще одного слова, с которым связано первое слово…

Так, что ли?
10:10
большая таблица… а не зависнет с такой громадиной?
10:14
Ну, на сайте настройки у пользователей по такому же принципу строятся. Притом, по строке на настройку. Вродь как работает…
с большими таблицами подвисать начинает… одна таблица удобнее, а вот как бы не пришлось разбивать, чтоб не завис…
10:16
Откуда инфа такая?
База данных с ее таблицами — это один такой большой текстовый файл. Разбитый на, скажем так, абзацы (таблицы). И по идее, поиск внутри абзаца должен происходить быстрее.
У меня уже с большими таблицами (на пять-семь тыщ строк) подвисает программа. Плавали, знаем…
10:21
Сколько комментариев здесь на сайте?
Это прекрасно, что комментов много, и ничего не виснет. А я дала программе сравнить таблицу и текст — программа зависла. А всего-то — найди в тексте слово, сравни с таблицей существительных. И с таблицей прилагательных. И найди пару существительное + прилагательное. На двух абзацах программа уже дохнет…
10:30
Значит, дело либо в программе, либо тормозном сервере. Либо неправильных индексах, кто знает. А то и в твоем интернете.

Потому что на сайте на данный момент больше 50 тысяч (больше где-то тысячи на 4, просто есть удаленные) комментариев. Каждый комментарий — это одна строка в общей таблице. Каждый раз, когда пользователь открывает страницу, в таблицу идет запрос на нужные комментарии, и выводятся те, которые к данной странице относятся. А пользователь может быть не один. Пользователей может быть одновременно несколько тысяч, и все лезут одновременно в базу таким макаром.

К чему это я… не стоит недооценивать возможности современных баз данных.
Сложная задача вырисовывается…
сделать таблицу на… гхм… десять столбцов. десять ассоциаций максимум. А если еще и не только индексы, но и слова — все двадцать.
И алгоритм:
найди в тексте предложение от точки до точки (варианты — А.С.Пушкин — пока не рассматриваем, ну их)
найди слова в предложении, какие есть в таблице существительных
занеси найденные слова в таблицу ассоциаций
найди в тексте первое слово из занесенных (например, первое слово было «книга»)
запиши в таблицу новую строку существительных из нового предложения с этим словом.
Проделай то же со всеми предложениями, где есть слово «книга»
посмотри, какие слова повторяются в ряде слов, какие нет.
оставь те, которые повторяются

Собака была приучена носить поноску за хозяином. = собака поноска хозяин
Гуго Баскервиль проскакал мимо меня на вороной кобыле, а за ним молча гналась собака, и не дай мне боже увидеть когда-нибудь такое исчадие ада у себя за спиной = кобыла собака исчадие спина
на сэра Чарльза бросилась какая-то собака и он умер от страха? = сжр собака страх
Фермеры говорят, что так воет собака Баскервилей, когда ищет свою
жертву. = фермер собака жертва
И ни фига общего…
13:15
Ну, тут скорее можно «чудовище — жетрва», а чудовищу разные формы придумывать.

Лучше скажи, как твой генератор будет поддерживать постоянство. Вот он назвал историю «Собака Баскервилей», что гарантирует, что он будет дальше писать о собаке, а не о кошке при следующем напоминании, и не о петухе через три главы?
В самом начале идет — выбор героя. И один и тот же герой будет на протяжении всей истории.
16:44
То есть, помимо героя будет и все остальное выбрано, верно? А где это записывается?
герой, а также время и место действия.
пока вроде в памяти программы.
Планирую сделать временную табличку «персонаж», туда вносить видовую принадлежность героя, ФИО, цели, планы, привычки…
То есть у меня уже есть таблица существительное + прилагательное — которую программа должна автоматически заполнять, но подвисает даже на малых объемах.
А надо еще такую же «существительное + глагол»
А теперь задача еще сложнее. Таблица Ассоциации, куда программа будет вписывать кучу слов к какому-то слову из разных предложений, а потом искать повторяющиеся слова-ассоциации и оставлять только их.
Значит, будет две таблицы ассоциаций. Временная (несем все из предложения) и постоянная — туда несем из временной повторяющиеся элементы.
Вот где зависнет так зависнет…
А надо делать, а не ходить вокруг да около, не бояться программы.
Хотя сейчас трудно что-то делать, я ж страшное дело сделала, вакцинировалась от вредного наглого вируса…
18:12
Поздравляю. Ну и не торопись с программой. Настройся сначала, осмысли все.

А зависает, возможно, от неправильного алгоритма.
Да, кажется, мы уже говорили, что программа перебирает все построчно сравнивает, а можно как-то иначе…
13:16
Насчет столбцов — чего сложного? Средняя структура таблиц сайта — 15-20 столбцов.
Больше всего радует, что таблицу придется ВРУЧНУЮ. Потому что программа совершенно не знает, что к чему относится… Или сделать прогу, пусть ищет во всех текстах сочетание со словом книга, и ищет, какие повторяются? То есть, книга и чашка кофе — случайное словосочетание, а книга и страница — частое, значит, это и есть ассоциация?
10:17
Открой, как-нибудь, базу данных в редакторе notepad++
10:11
Только тебе надо, чтобы программа могла делать выборку из кучи слов в одной ячейке, для этого надо ту кучу представлять в виде массива

Загрузка...












Все представленные на сайте материалы принадлежат их авторам.

За содержание материалов администрация ответственности не несет.


Рейтинг@Mail.ru