Андрей Карпати, один из первых инвесторов OpenAI и экс-глава AI в Tesla, ныне присоединившийся к Anthropic, предложил систему создания вики-слоя поверх сырых файлов. Эта система решает проблему низкого качества поиска информации в обычных чатах с моделями и избавляет от необходимости каждый раз перечитывать файлы с нуля.
Проблема работы с файлами в обычных чатах ⏱ 0:00
•При загрузке файлов в чат модель читает их каждый раз заново, тратя токены.•Качество поиска информации внутри данных — максимально низкое.•Модель может сделать вид, что прочитала файл, но не сделать это.•Ошибки, исправленные в одном запросе, не запоминаются для будущих — каждый раз нужно заново объяснять инструкции.Система Карпати: создание вики-слоя агентом ⏱ 0:34
•Идея: не давать модели читать сырые файлы каждый раз, а создать структурированную базу знаний (вики) с Markdown-файлами.•Используется агентная модель (Claude Coder, Codex, OpenCoder и др.).•Агент очищает мусор (HTML-теги), преобразует файлы в MD, разбивает по папкам, создает связи между файлами.•Добавляется Obsidian-слой для визуализации графа знаний.•В результате модель обращается к саммари и графу, а не к полным файлам — экономия токенов и повышение качества.Практический пример: исследование аудитории Telegram ⏱ 1:59
•Задача: сделать исследование аудитории по комментариям из Telegram-канала за месяц.•Сырые файлы — 3 HTML-файла, содержащие много кода (div, теги).•В Claude Coder создается проект, загружаются файлы, отправляется промт для создания вики.•Агент очищает HTML до MD, затем разбивает по папкам: сырые материалы, дата, вики, шаблоны.•Результат: граф знаний с вопросами, темами, профилем датасета (количество сообщений, топовые авторы, реакции).•После создания базы запрос "топ-10 идей для постов" выдает идеи, основанные на данных (например, "Claude бан", "кодекс обогнал Клод" и т.д.).Другие применения системы ⏱ 10:30
•YouTube-система автора: база из 20+ тысяч файлов (транскрипции, посты, статистика). Заголовки, обложки, сценарии — большая часть работы делается Клодом, автор лишь докручивает.•Медицинская база: объединение всех чатов с анализами, симптомами (проблемы с голосом), аптечкой и т.д. — один запрос решает рутинные задачи.•Другие примеры: подготовка к восхождению на вулкан, серфинг (анализ видео для улучшения катания), предпочтения в еде.•Система подходит для любых данных: от книги рецептов до построения соло-стартапа.Настройка промта с помощью улучшателя ⏱ 13:43
•В описании доступен готовый промт и ссылка на улучшатель промтов.•Нужно заменить input под свою задачу и запустить улучшатель.•Полученный улучшенный промт затем прогнать в агентной модели так же, как показано в видео.Ключевые выводы
•Самая большая проблема обычных чатов — модель каждый раз перечитывает файлы заново, тратя токены и получая низкое качество поиска.•Система Карпати решает это с помощью агента, который создает вики-слой из сырых файлов, очищая их, структурируя и связывая.•Агент (Claude Coder, Codex, OpenCoder) может работать с любыми данными: от комментариев Telegram до медицинских анализов и транскрипций видео.•Благодаря вики-слою ошибки исправляются один раз и больше не повторяются, а запросы к базе становятся быстрее и точнее.•Автор делится готовым промтом и улучшателем промтов бесплатно по ссылке в описании.Заключение
Система позволяет превратить любую коллекцию сырых файлов в умную базу знаний, которая работает быстрее и точнее обычных чатов. Это универсальное решение для работы с данными любого масштаба.