i
Полезная информация
19.01.2022
Бывает, что спамерский текст настолько противоречит реальному положению дел, что аж на смех пробирает!

В лучших традициях Задорнова...

В лучших традициях Задорнова...

По Задорнову.

Планы на год.

Несмотря на ошибки в чертежах и неправильную сборку запустить аэродинамическую трубу.

Если останусь жива...

 

Это я про генератор текстов.

Хочу его собрать. С самого начала.

А начало – это личность автора.

А как определяется личность автора?

Хватаюсь за первое понятное, - темы, на которые он пишет.

А как выявить тему?

Предполагаю – по определенным словам.

То бишь. Если встречаются слова – Париж, кафе, круассаны, платье, духи, флирт, поцелуй – это что-то милое, романтическое.

Если слова – лес, чаща, роща, мороз, ружье, пыжи, патроны, тетерев, - это тема охоты.

Было желание скачать 1000 самых распространенных существительных, сравнивать с текстами разных авторов. Например, взять текст автора, выбрать все существительные, убрать эти 1000 общих существительных, они все равно в каждом тексте – и посмотреть, какие встречаются другие существительные.

Решила попробовать свою гипотезу на произведениях неокей Марии Фомальгаут. И началось.

Был взят рассказ Угу-у-у. И что? Я не могу выбросить оттуда слово «дом», потому что идет противопоставление уютного дома и страшного внешнего мира ночью на улице. Уж никак не могу выбросить слово глаза – противопоставляются маленькие глазки юных голубят и жуткие глазища совенка. Не могу выбросить слово крылья – вся суть, что говорится вроде как про людей, а они крыльями машут. Слово небо не могу выбросить – ночное небо, на нем луна. И луну не могу выбросить, вокруг неё тоже вся соль текста.

А вот например, в рассказе Конан Дойля «Берилловая диадема» слово дом легко можно убрать, это слово неважно для текста.

Итак, получается два варианта:

Сравнить авторский текст с тысячей самых частых слов, убрать из авторского текста самые частые слова.

Из оставшихся слов выбрать самые часто встречающиеся – это и есть тема текста, его особенность.

Или второй вариант:

Сравнить авторский текст с тысячей слов, выбрать, какие слова из тысячи частых слов автор НЕ использует, и какие слова автор использует помимо тысячи слов.

Это что-то даст при генерации текста под какого-то автора. Хотя бы на уровне – НЕ используй эти слова, обязательно используй эти.

Но при разборе текста некоей Марии Фомальгаут все оказалось намного сложнее.

Например, дело не в том, что в тексте есть небо, а небо – звездное, темное, звездами утыканное, и не просто луна, а луна из-за горизонта выплывает, над лесом поднимается, большая, круглая, дивно пахнущая сыром, уу-ух…

И дело не в крыльях, а в крылышках – деточки, моем крылышки, и за стол.

Крылышки. Солнышки. Глазищи. И даже не так – оладьи, запеченные из солнышка. И совенок за столом просит кусочек луны. Важно, что не просто – а за столом, подтекст, что они и солнышко, и луну едят...

Ведь не написано прямым текстом - едят луну. 

Написано - едят оладушки из солнышка. И совенок просит кусочек луны.

И как программа вьедет, что тут луна за каким-то чертом съедобная стала? Никак не въедет. Потому что, например, сидят люди, обедают, один просит - а дайте мне газету - ну ясен же пень, что не жрать он её собирается. А у Марии Фомальгаут в книгах герой после обеда попросит газету и ею закусит на десерт.

Легко.

В этом Мария Фомальгаут. В сложнейшем контексте. А не в употребляемых словах.

Не дети, а детишечки, не город, а городок, не человек – песочный человек, открывает большим ключом луну.

Вот и думаю, есть ли смысл выбирать слова, которые использует автор, хотя бы для начала такое сделать. Или вообще не поможет.

Потому что тут как минимум довольно большие словосочетания и суффиксы, а как максимум – суть в  сложнейшем контексте.

А без этого никак. Генерация текста под автора начинается с ограничения – чего не должно быть у автора, что должно быть обязательно.

 

17:16
200
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Может, особенность Марии Фомальгаут — предметам присваиваются качества, им несвойственные? Песочный человек ключом открывает луну, спускается по невидимой лестнице… А в то же время луну могут и снять с неба, и запечь, и съесть, или, наоборот, испечь луну, чтобы повесить её на небо. А вечером загоняют в стойло, или, наоборот, утром.
Почему? Как компьютер это поймет?
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Сейчас пробую с другими авторами — та же фигня. Слово собака общее. Но. На этом слове все произведение Конан Дойля держится. Но. В то же время главная тема произведений Конан Дойля — не собаки. Значит, вроде как и правда можно отбросить эти 1000 распространенных слов… или нет? или выбрать существительные из каждого произведения автора, а потом выбрать слова, которые повторяются во всех текстах? Но опять же придется брать повторяющиеся слова минус тысяча распространенных — потому что ясен пень, что эта тысяча распространенных слов скорее всего будет…
0
Aagira Aagira 1 год назад #
А почему у тебя под «словами» подразумеваются лишь существительные?
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Хоть бы с ними разобраццо… а так-то все надо…

И главный вопрос — чем мои тексты отличаются от текстов других авторов? Я ответа не знаю. Чем я отличаюсь? Кто я?
Нейросеть не ответит, её саму мордой тыкать надоть…
0
Aagira Aagira 1 год назад #
Словосочетаниями.
Вообще, есть тема — о чем говорится. Есть рема — что говорится о теме (если по-примитивному). На одной теме текст не выедет.
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Да, как все сложно… а ведь моя главная задача не просто сгенерировать текст, а еще и под какого-то автора… думаю, какую таблицу сделать под автора, или программный код, что у автора будет вот такой сюжет…
0
Aagira Aagira 1 год назад #
Мне кажется, проблема «под автора» должна решаться позднее, когда программа начнет генерировать вменяемые тексты.
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Верно. Но хочется все и сразу.
Или хотя бы с начала.
Или хотя бы оценить размеры бедствия. А они огромны.
Потому что в следующем блоге я задала вопрос, чем я отличаюсь от других авторов.
Сейчас ищу ответ…
0
Aagira Aagira 1 год назад #
А я там поотвечала уже))
0
Aagira Aagira 1 год назад #
Скажи, а твоя программа может сгенерировать текст-рыбу для макета сайта?
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Бредогенератор?
0
Aagira Aagira 1 год назад #
Ну типа да. Нужен бред, напоминающий тексты разной длины. Для тестинга сайтовых модулей. Тех же сообщений например (на абзац, два, три). И подлиннее — для страниц.
0
Aagira Aagira 1 год назад #
Можешь мне сгенерировать сейчас длинную фразу, слов на десять? Слова, желательно, разной длины.
Нужно сымитировать длиннющий сайтовый ник, типа как у этого товарища: dabudetsolnce.ru/users/141
Желательно несколько вариантов.
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Ничего времени. Совиная сень по розе: в гостиную плоть большой мор. Прямо плачут часы, лабиринтом еще жизн часы, это они могут — идти… Королева гневается. Я продал мало два шахматного тира…

Холодный, холодный оконный ветер… узорчатый час занавески Казнил окно, только потом признался, что у него жуткая фобия на котов, и выйдет он иногда весь прекрасный…

Часы короновали полночь, призрачная площадь велик бежал круглым хвостом. Сто королевств и кровей шёлковая связь
0
Aagira Aagira 1 год назад #
лабиринтом еще жизн часы

Ошибка тоже оттуда?:ch_shocked:
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Тоже оттуда…

А вот герои с мого генератору:

Тюремный надзиратель ибис Паул, который мечтает научиться магии, умеет договариваться со всеми и больше всего на свете ценит собственную красоту.

Предложение Тайлер, которое работает мусоропроводчиком, жаждет власти, мечтает научиться летать и держит первенство в своей профессии.
0
Aagira Aagira 1 год назад #
Да, больше бы подошло, не будь опять предложениями. А он элементы предложений умеет, хоть, генерировать?
Пример я тебе дала.
Нет, вру, не предложения. Но все равно, не то. Ты же не будешь выдумывать себе псевдоним со словом «который»?
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Почему бы и нет…
Человек, который был четвергом (не мое)
Август, в который никто не придет (мое)

Там нет слова который, там вот так:

1). Выбор героя. слезинка.
2). Выбор имени. Лора.
3). Выбор профессии. бригадир железнодорожного пути.
4). Выбор настоящей цели. власть.
5). Выбор поддельной цели. свободу.
6). Выбор слабости. здоровье.
7). Выбор конечной цели, более приоритетной. репутацию. 8). Выбор конечной цели, которой изначально не было. близких.
9). Выбор чему хочет научиться. плавать.
10). Выбор способности. читать мысли.
11). Выбор внешности. кожа. 12). Выбор связки существительное-прилагательное для внешности.. 13). Выбор прилагательного для внешности. разговорный.
0
Aagira Aagira 1 год назад #
А откуда «который» берется?
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
А ниоткуда. Это я пыталась преобразовать эту анкету во что-то приличное…
0
Aagira Aagira 1 год назад #
Ах, вот оно что. А вывести в виде текста через готовые связки?
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Это бредогенератор ВКонтакте
0
Aagira Aagira 1 год назад #
Не похоже на псевдонимы:ch_sad:
Да нет, я, конечно, могу при тесте запулить «Сто королевств и кровей шёлковая связь», или узорчатый час занавески с ветром. Но вконтактовский бредогенератор ужасен.
Тем более, что надо именно персонажа, то есть, словосочетание или набор словосочетаний, а не полноценное предложение.
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Лето Ричард, которое работает референтом, его подводит память, оно мечтает о высоком статусе, но родные (какие у лета родные? Зима, осень, весна?) ему дороже статуса.
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Синица (синиц) Чарльз с узбекской улыбкой и слабым здоровьем работает метеорологом, больше всего ценит дружбу.
0
Aagira Aagira 1 год назад #
Анкета — так точнее. Набор характеристик, способ представить героя читателю в аннотации.

Если же персонажа назвать, то все характеристики будут в начале. Например:
Метеоролог со слабым здоровьем и узбекской улыбкой синиц Чарльз, ценитель дружбы (всем здрасьте!)
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
1). Выбор героя. чудо.
2). Выбор имени. Джитта.
3). Выбор профессии. фальцовщик.
4). Выбор настоящей цели. что-то красивое.
5). Выбор поддельной цели. свободу.
6). Выбор слабости. Родину.
7). Выбор конечной цели, более приоритетной. справедливость. 8). Выбор конечной цели, которой изначально не было. материальный достаток.
9). Выбор чему хочет научиться. читать.
10). Выбор способности. умение договариваться со всеми.
11). Выбор внешности. уши. 12). Выбор связки существительное-прилагательное для внешности.. 13). Выбор прилагательного для внешности. надписанный.
0
Aagira Aagira 1 год назад #
Согласна, что «который» может быть в кратком сочетании, когда упор идет именно на то, что стоит за «которым». Когда оно дает главную характеристику, а не кучу других. Тогда это звучит. У тебя там аж 13 позиций, а меньше нельзя делать по желанию?
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Можно, конечно, это я вывалила все, что можно про героя, а по факту будет меньше. Цель может быть всего одна.
И это пока план, а потом из этого плана будем отдельные фрагменты в готовый текст. Герой пошел туда-то — вставь название героя. К герою обратились по имени — вставь имя. Герой хочет что-то — вставь его цель.
0
Aagira Aagira 1 год назад #
Ясно.
0
Aagira Aagira 1 год назад #
Я сейчас с дороги, так что, не могу сообразить и написать что-то подходящее, так что пример на скорую руку:
Париж, кафе, круассаны, платье, духи, флирт, поцелуй – это что-то милое, романтическое

Мрачное окраинное кафе Парижа, заплесневевшие круассаны, которыми, вероятно, питаются сточные духи*. Все пропитано демоническим флиртом, кровавыми вурдалакскими поцелуями.

Вполне такой романтический эпизодик.

_____
*Ударения для программы указывать тоже нужно.
0
Мария Фомальгаут Мария Фомальгаут 1 год назад #
Это, кстати, обдумала, это в программе будет табличка, что автору нравится, что не нравится. То есть, обязательно будет указано про Париж, или это все нравится, или ужас-ужас…
0
Aagira Aagira 1 год назад #
А мне, может, именно так и нравится, иначе бы не придумала сходу.:ch_lol:

Все представленные на сайте материалы принадлежат их авторам.

За содержание материалов администрация ответственности не несет.

Top.Mail.Ru Яндекс.Метрика