AI генерация контента. Пост 1. Короткая историческая справка
Чтобы дальше было понятно, почему я считаю, что лучший способ писать контент — это переработка входной информации в текст, а не прямая генерация через LLM, начну с короткой исторической справки.
LLM — это модель, которая предсказывает продолжение текста. По сути, на каждом шаге она оценивает вероятности токенов, которые логично поставить дальше после входных данных. Она не думает как человек, не имеет собственного опыта и целей и не обладает “мнением”. Её задача — получить вход, прогнать его через веса и сгенерировать последовательность токенов, а temperature, top-p и похожие параметры лишь меняют, насколько случайным будет выбор вариантов.
LLM не может знать всё про всё
Количество встроенных знаний в модели ограничено и зависит от того, как и под что её обучали. Например, поэтому есть специализированные модели для кодинга, которые обучены программировать, и основные их знания — это область программирования.
Модель, которая будет знать всё про всё, — это уже уровень AGI.
Карта знаний LLM
На инфографике к посту я постарался отразить, как это может выглядеть на примере знаний в SEO и программировании. Модель понимает устоявшиеся вещи, может даже знать что-то хитрое, но поистине уникальными и важными знаниями она не обладает.
Очень утрированно
Все реально ценные знаний по SEO в ру сегменте заключены в курсах, реальных командах, а не в статьях в интернете и ТГ каналах. Эти знания сложно достать для обучения модели и я не думаю, что люди, которые обучают LLM пойдут на складчины выкачивать курсы по SEO. Даже если они это и сделают, то эти знания с огромной вероятностью не попадут в знания LLM.
Когда LLM чего-то не знает, она начинает выдумывать эту информацию или использовать SERP, чтобы вытащить из него пропуски знаний.
Когда вы пишете статью исключительно на основе промта типа «Ты SEO эксперт и E-E-A-T амбассадор, сбацай мне пост на тему “как продвигать магазин”, в самом начале ты должен привести пример работы и кейс, ну чтобы E-E-A-T прям тек из него», то LLM начнёт генерировать вам статью на основе своих знаний, полученных в ходе обучения, и очень условного ТОП-10 Google.
К чему это приведёт?