Китайский стартап DeepSeek, создающий большие языковые модели мирового уровня, не подумал о безопасности данных, пишут исследователи из Wiz Research. Им удалось получить доступ к нескольким базам данных DeepSeek.
О взломе речь не идёт. В Wiz Research обнаружили, что разработчики DeepSeek просто не установили пароли на публично доступные инстансы базы данных ClickHouse; зная адреса, к ним мог обращаться кто угодно.
Базы данных содержали логи чатов пользователей DeepSeek, ключи для доступа к API и другую внутреннюю информацию компании. Без аутентификации можно было проводить любые операции с базами.
![](https://i.playground.ru/p/YAgByCWu7KMReg1GDmI-kg.png?760xauto)
Wiz Research
Потенциально, пишут исследователи, речь шла о и получении контроля над инфраструктурой DeepSeek. Проводить этот эксперимент в Wiz Research не стали, компания связалась с разработчиками DeepSeek и те закрыли доступ к базам.
Неизвестно, получили ли доступ к базам данных DeepSeek злоумышленники, но это возможно: открытые базы нашли простым сканированием паролей. Если это произошло, то потенциально злоумышленник мог получить не только данные из баз, но и файлы с серверов стартапа.
Представители DeepSeek пока не комментировали возможную утечку данных.
полностью все в открытом доступе. от паролей-логинов-секретного слова до запросов и внутренней переписки.
Ради прикола спросите у нейронки рецепт приготовления свиных крылышек - ответ вам понравится.
Пацаны , выкинули исходный код в общество ... Что там вам не нравиться !!!
Исходный код и база данных - разные вещи. Представь что ты попросил чата придумать сложный пароль, а он уже оказался у всех на виду)
Не первая модель и не последняя с исходным кодом
Сама нейронка работает неплохо. Официальный чат правда перегружен. Я начал пользоваться чуть раньше бума популярности и тогда было прям норм. Но у меня один вопрос тогда возник: - Почему нейронка себя позиционирует, как созданная OpenAI?
Я это увидел, когда запросил у него документацию по API
Сейчас это расфорсилось и причины досконально неизвестны, но есть подозрение, что не всё так просто с ней. Опять же, помимо того, что она позиционирует себя как созданную OpenAI, достаточно заглянуть в документацию по API и увидеть - запросы в API OpenAI и в API DeepSeek, буквально, идентичны. Сами думайте почему, лично я думаю, что дело либо в промышленном шпионаже, либо в обучении DeepSeek через прямое взаимодействие с ChatGPT (или аналогами)
Вообще пофиг как она себя позиционирует, лиж бы работала без впн
Да, прямо как Россия украла американские чертежи гиперзвуковых ракет вместе с инженерами и уже поставила эти ракеты на вооружение, пока бедные американцы мучаются с прототипами. А обучать нейросеть через взаимодействие с другими сетями и при этом получить более дешёвый и быстрый аналог, это даже ещё круче оных чертежей.
Так и есть, она полностью построена на базе Chat GPT.
так они и не скрывали, мало ли человек будет писать в запросы как создать бомбу или еще что-то и чтоб доступ был у всех гос органов, к почтам и т.д Это важно! скрывать тут нечего ! Один сидит кораблик строит а другой автомат собирает. и патроны к нему. У людей много чего в голове.
Объясните пожалуйста как ИИ с открытым исходным кодом может быть взломана? Что там взламывать? Типа челы нашли способ прочитать логи переписок у пользователей? и всё?
Возможно, что логика обработки коннектома является открытой, в то время как сами веса могут быть закрытой инфой.
Типа могли утечь веса, что уже прям беда. Получение весов связано с бОльшими затратами: вычислительными, временными +гиговаты электричества + работа аналитиков данных, чтобы результатом обучения была нейронка, которая дает полезные ответы.
Почему тут настолько тупят люди? Ну пошевели своим мозгом. Причём тут исходный код? Что общего у этого с базой данных?
Так я поэтому и спросил, потому что не понимаю. Ты и не очень-то найс гай. Фак ю.
''Базы данных содержали логи чатов пользователей DeepSeek'' Это в статье написано.
Есть DeepSeek как модель нейронки. А есть сайт DeepSeek где эта модель используется. Судя по посту, утекли именно базы сайта. Даже не утекли, а были в открытом доступе относительно