У DeepSeek могли увести базу данных - на неё забыли поставить пароль

Китайский стартап DeepSeek, создающий большие языковые модели мирового уровня, не подумал о безопасности данных, пишут исследователи из Wiz Research. Им удалось получить доступ к нескольким базам данных DeepSeek.

О взломе речь не идёт. В Wiz Research обнаружили, что разработчики DeepSeek просто не установили пароли на публично доступные инстансы базы данных ClickHouse; зная адреса, к ним мог обращаться кто угодно.

Базы данных содержали логи чатов пользователей DeepSeek, ключи для доступа к API и другую внутреннюю информацию компании. Без аутентификации можно было проводить любые операции с базами.

Wiz Research

Потенциально, пишут исследователи, речь шла о и получении контроля над инфраструктурой DeepSeek. Проводить этот эксперимент в Wiz Research не стали, компания связалась с разработчиками DeepSeek и те закрыли доступ к базам.

Неизвестно, получили ли доступ к базам данных DeepSeek злоумышленники, но это возможно: открытые базы нашли простым сканированием паролей. Если это произошло, то потенциально злоумышленник мог получить не только данные из баз, но и файлы с серверов стартапа.

Представители DeepSeek пока не комментировали возможную утечку данных.

Комментарии: 16

Ваш комментарий

BigusDickus 30 января

полностью все в открытом доступе. от паролей-логинов-секретного слова до запросов и внутренней переписки.

ГАЗ-М20 30 января

Ради прикола спросите у нейронки рецепт приготовления свиных крылышек - ответ вам понравится.

Go_Ra 30 января

Пацаны , выкинули исходный код в общество ... Что там вам не нравиться !!!

-2

JustA_NiceGuy 30 января

Исходный код и база данных - разные вещи. Представь что ты попросил чата придумать сложный пароль, а он уже оказался у всех на виду)

PolGhost 30 января

Не первая модель и не последняя с исходным кодом

Сама нейронка работает неплохо. Официальный чат правда перегружен. Я начал пользоваться чуть раньше бума популярности и тогда было прям норм. Но у меня один вопрос тогда возник: - Почему нейронка себя позиционирует, как созданная OpenAI?

Я это увидел, когда запросил у него документацию по API

Сейчас это расфорсилось и причины досконально неизвестны, но есть подозрение, что не всё так просто с ней. Опять же, помимо того, что она позиционирует себя как созданную OpenAI, достаточно заглянуть в документацию по API и увидеть - запросы в API OpenAI и в API DeepSeek, буквально, идентичны. Сами думайте почему, лично я думаю, что дело либо в промышленном шпионаже, либо в обучении DeepSeek через прямое взаимодействие с ChatGPT (или аналогами)

-1

Сергей Оленичев PolGhost 30 января

Вообще пофиг как она себя позиционирует, лиж бы работала без впн

Gords PolGhost 30 января

я думаю, что дело либо в промышленном шпионаже, либо в обучении DeepSeek через прямое взаимодействие с ChatGPT (или аналогами)

Да, прямо как Россия украла американские чертежи гиперзвуковых ракет вместе с инженерами и уже поставила эти ракеты на вооружение, пока бедные американцы мучаются с прототипами. А обучать нейросеть через взаимодействие с другими сетями и при этом получить более дешёвый и быстрый аналог, это даже ещё круче оных чертежей.

ГАЗ-М20 PolGhost 30 января

Так и есть, она полностью построена на базе Chat GPT.

KitschSkeletor 30 января

так они и не скрывали, мало ли человек будет писать в запросы как создать бомбу или еще что-то и чтоб доступ был у всех гос органов, к почтам и т.д Это важно! скрывать тут нечего ! Один сидит кораблик строит а другой автомат собирает. и патроны к нему. У людей много чего в голове.

KeanuReeves 30 января

Объясните пожалуйста как ИИ с открытым исходным кодом может быть взломана? Что там взламывать? Типа челы нашли способ прочитать логи переписок у пользователей? и всё?

-6

Dr_Drift_RU 30 января

Возможно, что логика обработки коннектома является открытой, в то время как сами веса могут быть закрытой инфой.

Типа могли утечь веса, что уже прям беда. Получение весов связано с бОльшими затратами: вычислительными, временными +гиговаты электричества + работа аналитиков данных, чтобы результатом обучения была нейронка, которая дает полезные ответы.

Почему тут настолько тупят люди? Ну пошевели своим мозгом. Причём тут исходный код? Что общего у этого с базой данных?

KeanuReeves JustA_NiceGuy 30 января

Так я поэтому и спросил, потому что не понимаю. Ты и не очень-то найс гай. Фак ю.

''Базы данных содержали логи чатов пользователей DeepSeek'' Это в статье написано.

PolGhost KeanuReeves 30 января

Есть DeepSeek как модель нейронки. А есть сайт DeepSeek где эта модель используется. Судя по посту, утекли именно базы сайта. Даже не утекли, а были в открытом доступе относительно