Dostęp do tysięcy udostępnionych repozytoriów GitHub, teraz prywatnych, nadal jest możliwy za pośrednictwem Copilota

Badacze zajmujący się bezpieczeństwem ostrzegają, że dane udostępnione w Internecie, nawet na chwilę, mogą pozostać w internetowych generatywnych chatbotach opartych na sztucznej inteligencji, takich jak Microsoft Copilot, długo po tym, jak dane te staną się prywatne.
Według nowych ustaleń Lasso, izraelskiej firmy zajmującej się cyberbezpieczeństwem, która koncentruje się na nowych zagrożeniach związanych ze sztuczną inteligencją generatywną, ataki dotyczą tysięcy niegdyś publicznych repozytoriów GitHub należących do największych firm świata, w tym firmy Microsoft.
Współzałożyciel Lasso, Ophir Dror, powiedział serwisowi TechCrunch, że firma znalazła treści z własnego repozytorium GitHub, które pojawiły się w Copilot, ponieważ zostały zindeksowane i zbuforowane przez wyszukiwarkę Bing firmy Microsoft. Dror powiedział, że repozytorium, które zostało omyłkowo upublicznione na krótki okres, zostało od tego czasu ustawione na prywatne, a dostęp do niego w GitHub zwrócił błąd „strona nie została znaleziona”.
„Na Copilocie, co zaskakujące, znaleźliśmy jedno z naszych prywatnych repozytoriów” — powiedział Dror. „Gdybym przeglądał sieć, nie zobaczyłbym tych danych. Ale każdy na świecie mógłby zadać Copilotowi właściwe pytanie i uzyskać te dane”.
Po tym, jak Lasso zdało sobie sprawę, że jakiekolwiek dane przechowywane w serwisie GitHub, nawet krótkotrwałe, mogą zostać potencjalnie ujawnione przez narzędzia takie jak Copilot, firma rozpoczęła dalsze dochodzenie.
Lasso wyodrębnił listę repozytoriów, które były publiczne w dowolnym momencie w 2024 r. i zidentyfikował repozytoria, które zostały usunięte lub ustawione jako prywatne. Korzystając z mechanizmu buforowania Binga, firma odkryła, że ponad 20 000 repozytoriów GitHub, które były prywatne, nadal miało dane dostępne za pośrednictwem Copilot, co wpłynęło na ponad 16 000 organizacji.
Dotknięte organizacje to Amazon Web Services, Google, IBM, PayPal, Tencent i sam Microsoft, według Lasso. W przypadku niektórych dotkniętych firm Copilot może zostać poproszony o zwrot poufnych archiwów GitHub, które zawierają własność intelektualną, poufne dane korporacyjne, klucze dostępu i tokeny, podała firma.
Lasso zauważył, że użył Copilota do pobrania zawartości repozytorium GitHub — później usuniętego przez Microsoft — które zawierało narzędzie umożliwiające tworzenie „obraźliwych i szkodliwych” obrazów AI przy użyciu usługi AI w chmurze firmy Microsoft.
Dror powiedział, że Lasso skontaktowało się ze wszystkimi firmami, których dane zostały „poważnie dotknięte” wyciekiem i doradziło im rotację lub unieważnienie wszelkich naruszonych kluczy.
Żadna z poszkodowanych firm wymienionych przez Lasso nie odpowiedziała na pytania TechCrunch. Microsoft również nie odpowiedział na zapytanie TechCrunch.
Firma Lasso poinformowała Microsoft o swoich ustaleniach w listopadzie 2024 r. Microsoft poinformował Lasso, że sklasyfikował problem jako „o niskim stopniu powagi”, stwierdzając, że takie zachowanie pamięci podręcznej jest „akceptowalne”, a od grudnia 2024 r. Microsoft nie będzie już uwzględniał linków do pamięci podręcznej Binga w wynikach wyszukiwania.
Lasso twierdzi jednak, że mimo wyłączenia funkcji buforowania Copilot nadal miał dostęp do danych, mimo że nie były one widoczne w tradycyjnych wyszukiwarkach internetowych, co wskazuje na konieczność wprowadzenia tymczasowego rozwiązania.
techcrunch