nachricht

baidu encyclopedia blockiert google/bing und andere suchmaschinen, um zu verhindern, dass inhalte gecrawlt werden, um ki zu trainieren

2024-08-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

vor kurzem hat baidu encyclopedia damit begonnen, die meisten suchmaschinen wie google und bing zu blockieren. es wird erwartet, dass diese suchmaschinen und andere crawler daran gehindert werden, den inhalt der baidu encyclopedia ohne genehmigung für das training von ki abzurufen.

aus der robots.txt-datei der baidu encyclopedia geht hervor, dass derzeit nur wenige suchmaschinen wie baidu search, sogou search, china search (chinaso), yyspider und easou spider den inhalt crawlen dürfen.

der google-suche, der bing-suche, microsoft msn, yisouspider von uc browser und allen anderen suchmaschinen-crawlern ist das crawlen des inhalts der baidu-enzyklopädie ausdrücklich untersagt.

obwohl 360 search nicht separat in der sperrliste aufgeführt ist, besteht die richtlinie von baidu encyclopedia darin, alle crawler zu verbieten, die nicht auf der whitelist stehen, sodass 360 search und andere suchmaschinen ebenfalls blockiert werden.

allerdings dient dieser ansatz der baidu-enzyklopädie eigentlich nur dem schutz vor herren und nicht vor bösewichten. es muss viele crawler geben, die den inhalt weiterhin mit verschiedenen methoden durchsuchen und zum trainieren der ki verwenden.