С 24 апреля 2026 GitHub меняет политику — сбор кода и метаданных для обучения моделей становится дефолтным, а отключить его можно лишь вручную. Пользователи тарифов Free, Pro и Pro+ должны проверить настройки, чтобы гарантировать, что их закрытый код не будет использоваться в дальнейшем обучении.
Тарифы Business и Enterprise остаются защищёнными контрактом, а студенты в рамках GitHub Education сохраняют прежний статус.
GitHub Copilot — автодополняющий помощник, который генерирует строки кода, основываясь на текущем контексте редактора. Для улучшения качества генерации Microsoft использует данные взаимодействия пользователей, однако политика сбора данных меняется: теперь данные отправляются в обучающие наборы по умолчанию, если пользователь явно не отключит эту функцию.
| Аспект | Старый режим (до 24 апреля 2026) | Новый режим (с 24 апреля 2026) |
|---|---|---|
| Сбор кода для обучения | Не происходил без явного согласия | Включён по умолчанию, требуется отключить |
| Требуемое действие от пользователя | Никакого | Опция «opt‑out» в настройках |
| Тарифы, где действует | Free, Pro, Pro+ | Free, Pro, Pro+ (Business/Enterprise исключены) |
| Приватные репозитории «в покое» | Не сканировались | Сканы активного использования допускаются, если не отключено |
Опция отключения (opt‑out)
В настройках аккаунта GitHub есть переключатель Allow GitHub to use my data for AI model training. Снятие галочки прекращает передачу новых интерактивных данных в обучающие модели. Настройка привязана к аккаунту и действует во всех средах, где используется Copilot.
Сбор подсказок и их оценок
Каждая предложенная строка кода, а также её последующая правка, фиксируются. Пользовательские оценки («лайк»/«дизлайк») также попадают в набор данных, что позволяет моделям лучше различать полезные и шумные предложения.
Контекст кода вокруг курсора
Для генерации рекомендаций Copilot анализирует весь файл и соседние файлы, которые открыты в IDE. Этот контекст считается частью «interaction data» и, если отключение не выполнено, включается в обучающий датасет.
Комментарии и внутренняя документация
Текстовые комментарии, описания функций и любые markdown‑блоки, присутствующие в файлах, передаются вместе с кодом. Это помогает моделям лучше понимать смысловую нагрузку и назначение кода.
Структура проекта и навигация
Имена файлов, иерархия каталогов и паттерны перемещения по репозиторию собираются для построения более точных представлений о типичном проекте.
Все обращения к чат‑боту Copilot, а также ответы на встроенные подсказки, сохраняются. Это покрывает как запросы на объяснение, так и запросы на рефакторинг.
Разграничение по тарифным планам
Только подписки Free, Pro и Pro+ подпадают под новый режим. Тарифы Business и Enterprise включают пункт в договоре, запрещающий передачу пользовательских данных в обучение, поэтому для них действие опции не требуется.
Как это работает
При включённом режиме Copilot собирает «interaction data» — всё, что пользователь вводит, и всё, что система генерирует в ответ. Данные отправляются через зашифрованный канал в облако Microsoft, где они агрегируются и анонимизируются перед добавлением в наборы для обучения больших языковых моделей. Исключения составляют файлы, которые находятся в состоянии покоя: если репозиторий закрыт и Copilot не активен, данные не собираются. Однако при активном сеансе в приватном репозитории код попадает в набор, если пользователь не отключил передачу.
Как отключить сбор данных
- Перейдите по адресу github.com/settings/copilot/features.
- Найдите секцию «Privacy».
- Снимите галочку рядом с пунктом Allow GitHub to use my data for AI model training.
- Сохраните изменения.
Отключение можно выполнить в любой момент, но данные, уже попавшие в обучающие наборы до этого, не удаляются.
Эта информация важна для разработчиков, работающих с конфиденциальным или коммерческим кодом в приватных репозиториях, а также для команд, использующих бесплатные и платные тарифы Copilot без корпоративного контракта.