GitHub открыл датасет многоязычных репозиториев для ИИ
80+ млн строк метаданных по 40 млн публичных репозиториев: классификация языка README, issues и PR под CC0 — для оценки и обучения мультиязычных инструментов разработки.
Тег
Все статьи блога с этим тегом.
80+ млн строк метаданных по 40 млн публичных репозиториев: классификация языка README, issues и PR под CC0 — для оценки и обучения мультиязычных инструментов разработки.
14 MIT-компонентов от extend.ai: просмотр документов, bounding box citations, загрузка файлов и e-signature.
INSAIT выпустил Gemma 3–based модели 12B и 27B с поддержкой украинского, мультимодальность и инфраструктуру в Украине.
Open-source десктоп-приложение заворачивает MTProto в HTTPS к web.telegram.org — без VPN, серверов и подписки. ~6 МБ, один клик.