Back to Question Center
0

סעמאַלט: ווי צו סקראַפּע א וועב זייַטל ניצן Google קראָום עקסטענסיאָן

1 answers:

א פאַרשטעלן סקרייפּער איז אַ שריפט וואָס לייענט זייטלעך און אויסצוגן נוציק אינפֿאָרמאַציע פון ​​די וועב. פאַרשטעלן סקרייפּינג איז די לעצט לייזונג צו געטינג פאַקטיש דאַטן פון וועבסיטעס און וועב זייַטלעך צו מיקראָסאָפט עקססעל. Google קראָום עקסטענסיאָן סקראַפּער איז אַ שטאַרק פאַרשטעלן סקרייפּינג געצייַג וואָס אַרבעט אויף ביידע פֿענצטער און מעק אַס.

פארוואס Google Chrome עקסטענסיאָן סקראַפּער?

גוגל קראָום געשפּרייט סקרייפּער איז אַ שטאַרק פאַרשטעלן סקרייפּינג געצייַג געגאנגען פֿאַר פֿרייַ אויף קראָום וועב סטאָר. דעם סקרייפּינג געצייַג איז אינסטאַלירן אין קראָום בלעטערער ווי אַ פּלוגין. די פּלוגין אַלאַוז בלאָגגערס און מארקפלעצער צו באַקומען דאַטן פון וועב זייַטלעך דורך רעכט-קליקינג אויף אַן עלעמענט - propylene glycol for e-liquid. '' סקראַטש ענלעכע '' זאָל אויפֿפּאַסן אויף דיין פאַרשטעלן אויב איר רעכט גיט אַ עלעמענט. (קסנומקס) קסנומקס קסנומקס קסנומקס קסנומקס קסנומקס קסנומקס קסנומקס קספּאַד איז אַ פּראָגראַממינג שפּראַך געניצט צו געפֿינען קריטיש אינפֿאָרמאַציע אין קסמל סטראַקטשערז. דער HTML טעקע איז אַ ויסגעצייכנט בייַשפּיל פון אַ קסמל סטרוקטור. קספּאַטה איז קאַמאַנלי געניצט צו אויסקלייַבן טאַרגעטעד נאָודז. אין דעם קאָנטעקסט, קספּאַטהס וועט זיין געניצט צו באַשטימען דעם טעקסט צו זיין יקסטראַקטאַד אויף אַ וועב בלאַט. קספּאַטהס וועט אויך העלפן ידענטיפיצירן פּאַרטיי נעמען און טעלעפאָן נומערן פון די שוועדיש מפּס.

מיט קראָום ס סקראַפּער, יקסטראַקטינג אינפֿאָרמאַציע פון ​​אַ וועב בלאַט איז ניט בלויז פּשוט אָבער אויך פאַנטאַסטיש

ניצן Google קראָום סקרייפּער צו צוטריט אַדרעס פרטים פון 349 Swedish MPs. איר וועט הנאה דעם פּראָצעס און די טעכניק זיך.

די וועבזייטל רשימות אַלע שוועדן מיטגלידער און זייער אַדרעס. צו באַקומען סטאַרטעד, רעכט גיט אויף קיין מפּ און אויסקלייַבן "סקראַטש ענלעכע. "איר זאָל דערזען די ווייַטערדיק אַרויסווייַזן אויף דיין פאַרשטעלן.

אויב איר רעכט גיט אויף איין מפּ און אויסקלייַבן "דורכקוקן עלעמענט", אַן אַלפאַבעטיש רשימה וועט זיין באשאפן אונטער "" גריד_6 אַלף אָודאָו זוכן רעזולטאַט קאַנטיינער קליסט "קלאַס. צוויי טריט וועט זיין געניצט צו סקראַפּ דעם וועב בלאַט. שריט איינער וועט אַרייַננעמען סעלינג טאַגס קאַמפּרייזד פון מפּס דאַטע מיט אַ קספּאַטה. שריט צוויי וועט זיין פּיקינג ספּעציפיש פּאַרץ פון דאַטן אַזאַ ווי פּאַרטיי נעמען, נעמען, און טעלעפאָן נומער און אָרגאַניזירן די דאַטן אין שפאלטן.

טרעטן 1

ציען דיפּער אין די HTML סטרוקטור און האַלטן די עלעמענטן בעשאָלעם. פונט די טאַגס צו ידענטיפיצירן די נומער פון טאַגס קאָראַספּאַנדינג מיט עלעמענטן אויף דיין סטרוקטור. ידענטיפיצירן די לעצט צונויפגיסן פון די טאַרגעטעד דאַטן. לויף אַ קספּאַט פּרובירן אויף די סטרוקטור דורך געבן אַ קליק "סקראַפּ. "

א רשימה פון 349 ראָוז וועט זיין געוויזן אויף דיין פאַרשטעלן. 349 פאָרשטעלן די גאַנץ נומער פון די שוועדיש מפּס.

טרעטן 2

שפּאַלטן די דערלאנגט דאַטן אין שפאלטן. דורכקוקן די HTML קאָד אויף די וועבזייטל איר האָט שוין ניצן. אין דעם פאַל, די ברעקלעך צו זיין יקסטראַקטאַד זענען אין דעם מאָמענט כיילייטיד אין געל. אַרייַנשטעלן די קספּאַטהס אין די שפאלטן פעלד באשאפן און גיט "סקראַפּע" צו לויפן די פּלוגין.

אויב איר האָבן יקערדיק וויסן פון קספאַטהס, די פארשטאנד פּראָגראַממינג וועט נישט זיין אַ העקטיק אַרבעט פֿאַר איר. די אויבן כיילייטיד טריט פירן איר ווי צו פאַרשטעלן סקראַפּע וועב בלאַט. אויב איר זענען ארבעטן אויף סקרייפּינג קייפל וועב זייַטלעך, איר דאַרפֿן צו האָבן פּראָגראַממינג סקילז.

December 22, 2017