Hvordan å analysere deler av HTML Bruke VB

Den VB.NET språk inkluderer en HTML parsing klasse du bruker til å hente ut HTML verdier fra websider. Bruk de analyserte data for å evaluere innhold på et nettsted og returnere informasjonen til en bruker eller lagre hentet informasjon til en database. HTML parsing klassen lar deg lese tekstinnhold eller noen verdier i form elementer som tekstbokser eller drop-down bokser.

Bruksanvisning

1 Åpne Visual Studio-programvaren i "Microsoft .NET Framework" programgruppen. Åpne din VB prosjektet etter Visual Studio laster.

2 Høyreklikk på prosjektnavnet i "Solution Explorer" panel og velg "Properties". Klikk på ".NET" -kategorien, og deretter dobbeltklikker du på DLL-fil som heter "Microsoft.mshtml." Denne DLL omfatter klasser for å analysere HTML.

3 Legg biblioteket til VB kodefilen du vil bruke til å analysere HTML. Kopier og lim inn følgende VB uttalelse til toppen av koden din fil:

importen Mshtml

4 Instantiate "HTMLDocument" -klassen. Denne klassen importerer HTML-teksten du importert fra en webside eller streng og setter opp informasjonen for parsing. Legg til følgende kode til din parsing funksjon:

Dim parseHTML Som IHTMLDocument2 = Ny HTMLDocumentClass ()
Dim htmlData Som IHTMLElementCollection = parseHTML.body.all

5 Hente innhold fra HTML streng. For eksempel henter følgende kode verdien fra en HTML-tekstboks på en webside:

Dim tbData Som IHTMLInputElement = allElements.item ( "textbox1")
MsgBox "Dette er dataene i tekstboksen:" & tbData.Value