Een bericht uit augustus van dit jaar: ‘Cloudflare: Perplexity AI-bots bezoeken stiekem websites zonder toestemming.’ Kort en goed: volgens Cloudflare gebruiken de crawlers van Perplexity stealth-technieken door zich eerst te identificeren als officiële PerplexityBots, maar als ze worden geblokkeerd, veranderen ze van identiteit door zich voor te doen als gewone browsers, zoals Chrome op macOS, en wisselen ze IP-adressen. Dit zou betekenen dat Perplexity actief beperkingen omzeilt die bedoeld zijn om ongewenst crawlerverkeer te blokkeren.
Storing vandaag
Vandaag heb ik al verscheidene keren een melding gekregen dat challenges.cloudflare.com (een adres dat gebruikt wordt door Cloudflare voor zogenaamde Challenge Pages: tussenliggende pagina’s die Cloudflare toont aan bezoekers van een website om te verifiëren of het om een legitieme menselijke bezoeker gaat en niet om een geautomatiseerd script of bot) ‘gedeblokkeerd’ moest worden om Perplexity te kunnen laden. Hetzelfde gebeurde overigens bij ChatGPT. Blijkbaar betrof het een storing, waarover Tweakers inmiddels meldt: ‘Cloudflare zegt dat storing na drie uur is opgelost.’
Perplexity maakt dus zelf ook gebruik van de diensten van Cloudflare. Met name voor het verbeteren van de beveiliging en prestaties van hun eigen systemen en website. Cloudflare levert infrastructuurtechnologie zoals CDN, firewall en DDoS-bescherming die Perplexity dan gebruikt om hun platform veiliger en sneller te maken.
Brainstormen
Ik vroeg Perplexity om eens de rol van journalist aan te nemen en te brainstormen over mogelijke connecties tussen de twee gebeurtenissen: de controverse over de beschuldiging van Cloudflare aan het adres van Perplexity en de storing bij Cloudflare van vandaag. Dit was het antwoord:



Ik ben dan wel geen journalist, maar ik denk dat ik de berichtgeving voorlopig toch wel blijf volgen… 🤔
