10 Taishan live version af vilde børn (dyr opdrættet af børn)

Jeg begyndte for nylig at arbejde på et eksisterende Wordpress-websted, der blev grundigt moderniseret for 3 måneder siden. https://thedoctorwithin.com. Jeg er lidt ny i Wordpress, så jeg tænkte, at jeg skulle nå ud til nogle af eksperterne i samfundet.

Når jeg kontrollerer 'Ikke fundet' Crawlfejl i Google Search Console, bemærker jeg mange irrelevante links, der ikke findes på hjemmesiden eller databasen, så tæt som jeg kan fortælle. Når jeg kontrollerer kilden til disse irrelevante links, bemærker jeg, at de alle er genereret fra forskellige sider på webstedet såvel som ikke-eksisterende sider, angiveligt på webstedet, selvom disse fejlagtige sider aldrig har eksisteret. For nylig foretog en grundig søgning og udskiftning og konverterede alle de gamle links på webstedet til det nuværende, for det meste flade hierarki.

Her er et eksempel på det link underlige jeg ser:

-https: //thedoctorwithin.com/category/seminars/newsletters/page/7/newsletters/page/3/feedback-and-testimonials/ angiveligt linket fra: - https://thedoctorwithin.com/category/seminars/newsletters/ side / 7 / nyhedsbreve / side / 3 / (findes ikke)

I andre tilfælde rapporteres disse tåbelige webadresser at være linket til fra vores sitemap. BTW - alle webadresser i sitemap er gyldige webadresser.

I øjeblikket har webstedet en flad struktur. Næsten alt indholdet er kun URL / indhold / uden yderligere opdeling (eller underkataloger). Tidligere webstedsversioner havde en mere varieret sideorganisering, men det jeg ser ser ikke ud til at afspejle den aktuelle sideorganisation eller den tidligere sidestruktur.

Havde et lignende problem kommet op i forbindelse med brug af Divis søgefunktion. Endte med nogle ret dybe ikke-eksisterende links forgrenet af / søg /, såsom:

  • https://thedoctorwithin.com/search/newsletters/page/2/feedback-and-testimonials/feedback-and-testimonials/online-continuing-education/consultations/ (aldrig eksisteret) angiveligt linket fra:
  • https://thedoctorwithin.com/search/newsletters/page/2/feedback-and-testimonials/feedback-and-testimonials/online-continuing-education/ (findes ikke).

Jeg blokerede / søgningen / filialerne via robots.txt. Intet reelt tab, da hverken / search / eller nogen af ​​dets underkataloger er gyldige.

Der er adskillige allerede eksisterende kategorier og tags på webstedet. Kategorierne og tags bruges ikke som sider. Jeg formoder, at Google (og andre motorer) muligvis opretter vilkårlige stier ud fra disse kombineret med andre ældre links og kategorier. Når jeg kigger gennem webstedets 404-fejl, ser jeg også lignende opførsel fra Bing, Moz og andre edderkopper.

Jeg formoder, at jeg kunne bruge Search Console til at fjerne URL / kategori / og URL / tag /. Jeg formoder, at jeg kunne gøre det samme med hensyn til andre legitime edderkopper / søgemaskiner. Måske ville det være bedre at bruge Mod Rewrite til at føre edderkopper til sider, der faktisk findes.

  • Kunne denne mærkelige spidering-opførsel indikere, at der skal rettes noget på webstedet?
  • Jeg glæder mig over forslag til bedste praksis til håndtering af disse vildfarne søgninger. Som nævnt ovenfor har jeg markeret dem alle rettet, men de vender tilbage.
  • Jeg glæder mig over yderligere viden om, hvorfor disse mærkelige links forekommer.

BTW - Jeg har sjældent lagt ud på Stack Exchange. Jeg glæder mig over ethvert forslag til, hvordan jeg kan forbedre mit indlæg her i fremtiden.

Tak skal du have.

  • Nå, er ikke dette specielt. Darkweb flyttede derovre. OK, hvis du er en hvid hatter, kan du oprette en php-fil med samme navn og bruge php til at hacke og skære darkweb-serveren og den tilsluttende klient.

ja jeg ville være bekymret over dette. Hvis du får statistik til filer, bibliotekstruktur og ikke på hostingdrevet, kopierede nogen den private nøgle og hostede en version af dit websted på din url.

Dette er det første tegn på darkweb-aktivitet.

Ting, du skal gøre:

først skal du finde ud af, om båndbredden er ude af kontrol, du vil se en overdreven brug af båndbredde fra en ip-adresse, spore den tilbage, det vil sandsynligvis afsløre en vpn-forbindelse, der maskerer piratens server (fordi de stjæler din båndbredde til at betjene deres webserver på dit websted).

Bloker denne person !!

kontrollere, om xml-rpc-modulet er deaktiveret. Hvis det er aktiveret, skal du deaktivere det: https://wordpress.org/plugins/disable-xml-rpc/ Sørg for, at ingen kan katalogsurfe. (tilføj: Indstillinger-indekser til .htaccess-filen)

udskift servercertifikat. Slet den eksisterende, og brug den aldrig igen.

  • Med "darkweb" mener du, at webstedet er hacket og bruges til andre formål?

arbejdet for dig: Charles Robertson | Ønsker du at kontakte os?

nyttige oplysninger