Hvordan beregne Likhet Factor i dokumenter i PHP

Hvis du tillater brukere å laste opp innhold til nettstedet ditt, fange plagiert innhold kutter ned på kostnadene for lagring av stjålne artikler og tekst. Du kan bruke PHP til å vurdere innholdet og returnere en prosentandel som representerer likheten faktor for to nettadresser. Dette lar deg gjennomgå nettsteder og sammenligne to nettadresser med hverandre for å finne ut om en sideinnholdet er lik en annen URL innhold.

Bruksanvisning

1 Åpne din PHP editor og kildekoden filen du vil bruke til å gjennomgå webadressene og sammenligne lignende innhold.

2 Lag to URL variabler og sette opp en tredje variabel som returnerer antall tegn som passer i de to sidene. Den følgende koden setter opp variabler:

$ Url1 = '';
$ Url2 = '';
$ Samme = 0;

3 Skaff innholdet i de to nettadresser. Følgende kode initialiserer og henter innholdet for to nettadresser:

$ Curl = curl_init ();

curl_setopt ($curl, CURLOPT_URL,$url1);

$ Contents1 = curl_exec ($ curl);
curl_setopt ($ curl, CURLOPT_URL, $ url2);
$ Contents2 = curl_exec ($ curl);

4 Sammenlign de to URL innholds strenger. Følgende kode returnerer antall påfølgende tegn fra "$ contents1" som samsvarer med innholdet i "$ contents2":

$ Lignende = strstr ($ contents2, $ contents1);
$ Similarcount = strlen ($ lignende);

5 Del "$ similarcount" verdien av den totale strengen lengden på "$ contents1." Dette tallet gir deg likheten faktor eller prosentandelen av lignende innhold som samsvarer fra den opprinnelige URL. Bruk følgende kode for å beregne faktor:

$ Faktor = $ similarcount / (strlen ($ contents2));
echo $ faktor;