Reddit, popüler başlıkların ve içeriklerin Internet Archive (IA) tarafından arşivlenmesini kısıtlamaya başladı. Bunun sebebi olarak, Reddit’in veri kazıma (scraping) faaliyetlerinden men ettiği bazı yapay zekâ şirketlerinin, verileri doğrudan Reddit’ten çekmek yerine IA’nın Wayback Machine arşivlerinden toplaması gösteriliyor.
Internet Archive ve Wayback Machine Nedir?
İnternet Archive, 1996 yılında kurulan ve internet üzerindeki bilgileri uzun vadeli olarak korumayı amaçlayan kar amacı gütmeyen bir dijital kütüphane. Bu platformun en bilinen hizmetlerinden biri ise Wayback Machine. Wayback Machine, web sitelerinin geçmiş sürümlerini arşivleyerek kullanıcılara, sitelerin belirli tarihlerde nasıl göründüğünü inceleme imkânı sunuyor. Bu sayede, silinmiş içerikler, eski tasarımlar veya artık erişilemeyen sayfalar geriye dönük olarak görüntülenebiliyor. Araştırmacılar, gazeteciler ve sıradan internet kullanıcıları için değerli bir kaynak olan bu araç, dijital tarihin korunmasında kritik bir rol oynuyor. Ancak, arşivlenmiş verilerin gizlilik ve telif hakları gibi konularda zaman zaman tartışmalara yol açtığı da biliniyor.
Artık Yalnızca Ana Sayfa Görselleri Arşivlenecek
Geçmişte Wayback Machine, Reddit sayfalarını, profilleri ve yorumları düzenli olarak arşivleyerek internetin dijital belleğine katkı sağlıyordu. Ancak yeni düzenleme ile birlikte artık sadece Reddit ana sayfasının ekran görüntüleri arşivlenecek.
Bu değişiklik, arşivin işlevselliğini büyük ölçüde sınırlandıracak. Artık silinmiş gönderileri kurtarmak ya da belirli bir subreddit kültürüne göz atmak mümkün olmayacak. Bunun yerine, arşiv sadece günlük olarak öne çıkan gönderilerin ve haber başlıklarının bir “anlık görüntüsünü” sunacak.
Reddit, AI Şirketlerini Açıkça Suçlamıyor
Reddit, hangi AI şirketlerinin bu yöntemi kullandığını açıklamadı. Ancak Reddit sözcüsü Tim Rathschmidt, Ars Technica’ya yaptığı açıklamada, Reddit’in “platform politikalarını ihlal eden ve Wayback Machine’den veri çeken AI şirketlerinden haberdar olduğunu” belirtti.
Rathschmidt, IA’nın AI veri kazımasına karşı daha iyi koruma önlemleri alabileceğini ve bu durumda Reddit’in kısıtlamaları gevşetebileceğini ima etti. The Verge’ün haberine göre bu kısıtlamalar, bugünden itibaren Reddit genelinde daha da artırılacak.
Gizlilik Endişeleri de Etkili
Reddit, bu kararı sadece AI şirketlerini engellemek için değil, aynı zamanda uzun süredir devam eden gizlilik sorunlarını da çözmek amacıyla aldığını söylüyor. Rathschmidt, Wayback Machine’in kullanıcıların sildiği içerikleri arşivlemesinin problemli olduğunu vurguladı ve şu ifadeyi kullandı:
“IA, platform politikalarına uymak ve kullanıcı gizliliğini korumak için adımlar atana kadar Reddit verilerine erişimlerini sınırlıyoruz. Bu, redditor’ları korumak için gerekli.”
Geçmişte bazı kullanıcılar, Wayback Machine’i silinmiş yorumları veya gönderileri araştırmak için kullandıklarını sosyal medyada dile getirmişti. Ancak birçok kullanıcı, bunun için farklı araçlar bulunduğunu ve Wayback Machine’in bu amaçla en pratik çözüm olmadığını da kabul ediyor.
Topluluk Arşivlere Zaman Zaman Başvuruyor
Reddit kullanıcıları, platformda büyük değişiklikler olduğunda IA gibi arşiv kaynaklarına yöneliyor. Örneğin, 2023 yılında Reddit’in halka açık API’sinde yapılan değişiklikler nedeniyle bazı popüler subreddit’lerin kapanma tehlikesi doğmuştu. O dönemde, içerikler tamamen silinmeden önce arşivler devreye girerek bunları koruma altına almıştı.
IA, Reddit’in kısıtlamalarının kaldırılması için çalışıp çalışmayacağına dair herhangi bir açıklama yapmadı. Ars Technica’nın yorum talebine de yanıt vermeyen IA, bu değişikliğin arşivin açık web kaynağı olarak kullanılabilirliğini nasıl etkileyeceğine dair görüş bildirmedi.
Wayback Machine’in direktörü Mark Graham, Reddit ile uzun süredir iyi ilişkiler içinde olduklarını ve bu konuda görüşmelerin devam ettiğini belirtti.
Maddi Motivasyon İhtimali
Sektör gözlemcileri, Reddit’in bu adımı maddi nedenlerle de atmış olabileceğini düşünüyor. Özellikle AI şirketleriyle yapılacak veri lisans anlaşmaları, Reddit için önemli bir gelir kapısı haline gelmiş durumda.
Nitekim şirket, daha önce OpenAI ve Google ile veri lisans anlaşmaları imzaladı. OpenAI anlaşmasının detayları açıklanmazken, Google anlaşmasının 60 milyon dolar değerinde olduğu bildirildi. Reddit, önümüzdeki üç yıl içinde bu tip anlaşmalardan 200 milyon dolardan fazla gelir elde etmeyi bekliyor.
Bu açıdan bakıldığında, Wayback Machine gibi açık kaynak arşivlerin AI şirketlerine veri sağlaması, Reddit’in ticari çıkarlarına doğrudan zarar verebilir. Dolayısıyla Reddit, hem kullanıcı gizliliği hem de ticari kazanç açısından IA’nın arşivleme faaliyetlerine kısıtlama getirmiş görünüyor.
Sonuç
Reddit’in bu hamlesi, internet arşivleme kültürü, kullanıcı gizliliği ve yapay zekâ veri erişimi arasındaki dengeyi yeniden tartışmaya açtı. Bir yandan AI şirketlerinin etik veri toplama yöntemleri sorgulanırken, diğer yandan kullanıcıların geçmiş içeriklere erişim hakkı da daralıyor.
IA’nın bu kısıtlamaları aşmak için ne tür teknik veya politik önlemler alacağı belirsizliğini koruyor. Ancak net olan şu ki: Reddit’in veri erişimi üzerindeki kontrolü giderek artıyor ve bu durum hem AI şirketlerini hem de açık internet savunucularını yakından ilgilendiriyor.