Hvordan lese et Word-dokument med C

Hvordan lese et Word-dokument med C


Noen ganger må du ta en stor mengde data fra en Microsoft Word-fil og konvertere den til enkel tekst i notepad for koding. Du kan spare en god del tid ved å lage et verktøy i C # som gjør dette automatisk for deg. Når du oppretter code programmer, vil du unngå å bruke Word tekst direkte, fordi du utilsiktet kopiere Microsoft Word formatering også. Ved hjelp av C # programmet, vil formatet koding Word fjernes når den er limt til en notisblokk dokument. For å lage det programmet du trenger en C # kompilatoren, slik som gratis versjoner av Microsoft Visual Studio Express, Turbo C eller Digital Mars. Alle disse kompilatorer bruke lignende grensesnitt for å lage C # program programmer.

Bruksanvisning

1 Åpne Word-dokument som du vil at teksten skal kopieres. Legg til tekst eller informasjon her og lagre det ferdige dokumentet i "C:" kjøre så dokument.doc. Minimer ord til Windows verktøylinjen.

2 Åpne C # kompilatoren du velger, ved å klikke på ikonet under "Programmer" i "Start" -menyen. Velg "File" og deretter "nytt prosjekt." Velg "Windows Forms Application" mal, og klikk "OK." Vent til det nye prosjektet vindu skal vises.

3 Se på venstre side av skjermen, og klikk på "Project-menyen." Velg "Legg referanse" fra listen over tilgjengelige alternativer. Vent et nytt vindu for å dukke opp. Velg "Net" -fanen og velg "Microsoft.Office.Interop.Word" fra de tilgjengelige alternativene, og klikk "OK." På denne måten vil du legge til en referanse til filen du bruker for å få tilgang til Word-dokument.

4 Gå til høyre på skjermen og finne "Form1.cs." Dobbeltklikk på den for å gå til kildekoden. Legg denne koden instruksjon:

bruker Word = Microsoft.Office.Interop.Word;

bruker System.IO;

5 Se etter følgende kode i hoved kompilatoren skjermen:

private void Form1_Load (objekt avsenderen, EventArgs e)

{}

6 Sett inn følgende kode i "{}" du fant i trinn 5:

Word.ApplicationClass wordApp = new Word.ApplicationClass ();

object file = @"C:\document.doc";

protestere nullobj = System.Reflection.Missing.Value;

Word.Document doc = wordApp.Documents.Open (ref fil, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj,

ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj);

Forvent denne koden for å kopiere alt innholdet fra Word-dokumentet heter dokument.doc ligger i "C:" til notepad tekstfil.

doc.ActiveWindow.Selection.WholeStory();

doc.ActiveWindow.Selection.Copy ();

IDataObject data = Clipboard.GetDataObject ();

Stream write = new Stream (@ "C: \ text.txt");

write.WriteLine (data.GetData (DataFormats.Text) .ToString ());

write.Close ();

doc.Close (ref nullobj, ref nullobj, ref nullobj);

7 Finn "Debug" fanen på toppen av skjermen, og klikk på den. Fra menyen velger du «Start debugging." Dette vil kopiere innholdet i Word-dokumentet til tekstfilen.

8 Lukk Microsoft Word-dokument, slik at du bare vil bruke teksten fra C # kompilatoren. Når du ønsker å legge til mer tekst til tekstfilen, kan du legge det til dokumentet og klikk på "Start debugging" igjen i C # kompilatoren.