Кarpathy показал, как Claude сам строит базу знаний

Source
ru-orig
May 25, 2026 May 26, 2026
Video preview
Share:

Андрей Карпати, один из первых инвесторов OpenAI и экс-глава AI в Tesla, ныне присоединившийся к Anthropic, предложил систему создания вики-слоя поверх сырых файлов. Эта система решает проблему низкого качества поиска информации в обычных чатах с моделями и избавляет от необходимости каждый раз перечитывать файлы с нуля.

Проблема работы с файлами в обычных чатах ⏱ 0:00

  • При загрузке файлов в чат модель читает их каждый раз заново, тратя токены.
  • Качество поиска информации внутри данных — максимально низкое.
  • Модель может сделать вид, что прочитала файл, но не сделать это.
  • Ошибки, исправленные в одном запросе, не запоминаются для будущих — каждый раз нужно заново объяснять инструкции.
  • Система Карпати: создание вики-слоя агентом ⏱ 0:34

  • Идея: не давать модели читать сырые файлы каждый раз, а создать структурированную базу знаний (вики) с Markdown-файлами.
  • Используется агентная модель (Claude Coder, Codex, OpenCoder и др.).
  • Агент очищает мусор (HTML-теги), преобразует файлы в MD, разбивает по папкам, создает связи между файлами.
  • Добавляется Obsidian-слой для визуализации графа знаний.
  • В результате модель обращается к саммари и графу, а не к полным файлам — экономия токенов и повышение качества.
  • Практический пример: исследование аудитории Telegram ⏱ 1:59

  • Задача: сделать исследование аудитории по комментариям из Telegram-канала за месяц.
  • Сырые файлы — 3 HTML-файла, содержащие много кода (div, теги).
  • В Claude Coder создается проект, загружаются файлы, отправляется промт для создания вики.
  • Агент очищает HTML до MD, затем разбивает по папкам: сырые материалы, дата, вики, шаблоны.
  • Результат: граф знаний с вопросами, темами, профилем датасета (количество сообщений, топовые авторы, реакции).
  • После создания базы запрос "топ-10 идей для постов" выдает идеи, основанные на данных (например, "Claude бан", "кодекс обогнал Клод" и т.д.).
  • Другие применения системы ⏱ 10:30

  • YouTube-система автора: база из 20+ тысяч файлов (транскрипции, посты, статистика). Заголовки, обложки, сценарии — большая часть работы делается Клодом, автор лишь докручивает.
  • Медицинская база: объединение всех чатов с анализами, симптомами (проблемы с голосом), аптечкой и т.д. — один запрос решает рутинные задачи.
  • Другие примеры: подготовка к восхождению на вулкан, серфинг (анализ видео для улучшения катания), предпочтения в еде.
  • Система подходит для любых данных: от книги рецептов до построения соло-стартапа.
  • Настройка промта с помощью улучшателя ⏱ 13:43

  • В описании доступен готовый промт и ссылка на улучшатель промтов.
  • Нужно заменить input под свою задачу и запустить улучшатель.
  • Полученный улучшенный промт затем прогнать в агентной модели так же, как показано в видео.
  • Ключевые выводы

  • Самая большая проблема обычных чатов — модель каждый раз перечитывает файлы заново, тратя токены и получая низкое качество поиска.
  • Система Карпати решает это с помощью агента, который создает вики-слой из сырых файлов, очищая их, структурируя и связывая.
  • Агент (Claude Coder, Codex, OpenCoder) может работать с любыми данными: от комментариев Telegram до медицинских анализов и транскрипций видео.
  • Благодаря вики-слою ошибки исправляются один раз и больше не повторяются, а запросы к базе становятся быстрее и точнее.
  • Автор делится готовым промтом и улучшателем промтов бесплатно по ссылке в описании.
  • Заключение

    Система позволяет превратить любую коллекцию сырых файлов в умную базу знаний, которая работает быстрее и точнее обычных чатов. Это универсальное решение для работы с данными любого масштаба.

    Visual Highlightsbeta