Web Scraping και Εφαρμογές Εξόρυξης Κειμένου με Python 3

Πιστοποιημένο πρόγραμμα επιμόρφωσης από το με θεματολογία

Σύντομη περιγραφή προγράμματος
Το πρόγραμμα εστιάζει στη συλλογή (web scraping) και επεξεργασία δεδομένων κειμένου (text mining). Χαρακτηριστικά παραδείγματα δεδομένων text είναι οι κριτικές πελατών και ειδικών (customer and expert reviews), τα σχόλια των χρηστών σε πλατφόρμες κοινωνικής δικτύωσης (social media posts), blogs, άρθρα σε πλατφόρμες ενημέρωσης (news articles) και οι περιγραφές προϊόντων σε ιστοσελίδες ηλεκτρονικού εμπορίου. Η ύλη του προγράμματος καλύπτει όλα τα στάδια της διαδικασίας που πρέπει να ολοκληρώσει καποιος που επιθυμεί να δουλέψει με δεδομένα κειμένου: συλλογή από τον παγκόσμιο ιστό (web scraping), προετοιμασία (clearing and parsing) και ανάλυση. Μέσα από το μάθημα, οι εκπαιδευόμενοι θα αποκτήσουν τις απαραίτητες γνώσεις πάνω στη γλώσσα προγραμματισμού Python και θα μάθουν πως να χρησιμοποιούν την Python για να λύσουν πρακτικά προβλήματα σχετικά με δεδομένα κειμένου, όπως επεξεργασία συναισθημάτων (sentiment analysis), κατηγοριοποίηση (classification), μοντελοποίηση θεμάτων (topic modeling), δημιουργία περιλήψεων summarization), και επεξεργασία οντοτήτων (entity extraction and disambiguation).
Τρόπος διεξαγωγής
Το πρόγραμμα χρησιμοποιεί την εκπαιδευτική μέθοδο eLearning: η μάθηση γίνεται αμιγώς ασύγχρονα (δηλαδή σε ημέρες και ώρες που εξυπηρετούν τον καταρτιζόμενο, χωρίς να υπάρχει υποχρεωτική παρακολούθηση σε συγκεκριμένη ώρα ή ημέρα), αποκλειστικά εξ αποστάσεως (με χρήση ειδικής εκπαιδευτικής πλατφόρμας μέσω διαδικτύου και Η/Υ από το χώρο του καταρτιζόμενου) και με την χρήση ψηφιακών εκπαιδευτικών εργαλείων όπως η παρακολούθηση βιντεοδιαλέξεων, η επίλυση διαδραστικών ασκήσεων αυτοαξιολόγησης και άλλα εργαλεία elearning που εξασφαλίζουν την αποτελεσματική και ευέλικτη ατομική αυτό-εκμάθηση. Το εκπαιδευτικό υλικό του προγράμματος γίνεται διαθέσιμο σε συγκεκριμένες χρονικές περιόδους, με βάση το μονοπάτι εκπαίδευσης που ακολουθείται, και εν συνεχεία παραμένει διαθέσιμο στην πλατφόρμα εκπαίδευσης χωρίς περιορισμούς σε όλη τη διάρκεια του προγράμματος.
Μαθησιακά αποτελέσματα
Στο τέλος του εκπαιδευτικού προγράμματος, ο εκπαιδευόμενος θα είναι σε θέση να χρησιμοποιεί την Python για να:

  • Γράφει χρήσιμα scripts για πρακτικά tasks
  • Αξιοποιεί δημοφιλείς δομές δεδομένων και βιβλιοθήκες
  • Συλλέγει αυτόματα μεγάλους όγκους δεδομένων από τον παγκόσμιο ιστό
  • Επεξεργάζεται δεδομένα κειμένου και να τα προετοιμάζει για ανάλυση
  • Εξάγει πολύτιμες πληροφορίες από μεγάλους όγκους δεδομένων κειμένου
  • Αναλύει κριτικές πελατών
  • Αναλύει περιγραφές προϊόντων
  • Χρησιμοποιεί δεδομένα κειμένου για να αξιολογήσει την ανταγωνιστικότητα ανάμεσα σε δύο οντότητες (π.χ. προϊόντα ή επιχειρήσεις)
  • Αναλύει σχόλια χρηστών από πλατφόρμες κοινωνικής δικτύωσης
  • Εξάγει απόψεις και συναισθήματα από δεδομένα κειμένου
  • Αξιολογεί διάφορες διαστάσεις δεδομένων κειμένου
  • Δημιουργεί μια αντιπροσωπευτική περίληψη μιας μεγάλης συλλογής κειμένων
  • Ομαδοποιεί και κατηγοριοποιεί κείμενα με βάση την λεξικογραφική και νοηματική ομοιότητά τους.
  • Επιλέγει αντιπροσωπευτικές λέξεις (tags) που περιγράφουν με ακρίβεια ένα προϊόν ήοποιαδήποτε άλλη οντότητα για την οποία υπάρχουν διαθέσιμα δεδομένα κειμένου.
Θεματικές ενότητες
  1. Εισαγωγή στην Python
    (Διάρκεια Θεματικής Ενότητας: 4 εβδομάδες) Εγκατάσταση Python και των σχετικών βιβλιοθηκών, Εισαγωγή στην Python Ι: θεμελιώδεις έννοιες και απλά προγράμματα, Εισαγωγή στην Python ΙΙ: Δομές Δεδομένων, Εισαγωγή στην Python ΙΙΙ: Διαβάζοντας και γράφοντας σε αρχεία κειμένου.
  2. Συλλογή και Επεξεργασία Κειμένων
    (Διάρκεια Θεματικής Ενότητας: 3 εβδομάδες) Συλλογή δεδομένων κειμένου από τον παγκόσμιο ιστό I (Web Scraping), Συλλογή δεδομένων κειμένου από τον παγκόσμιο ιστό II, Συλλογή δεδομένων κειμένου από τον παγκόσμιο ιστό III, Επεξεργασία και προετοιμασία δεδομένων I (Data Cleaning and Parsing) .
  3. Εφαρμογή Text Mining 1: Ανάλυση Απόψεων και Συναισθημάτων (Opinion and Sentiment Analysis)
    (Διάρκεια Θεματικής Ενότητας: 2 Εβδομάδες)
    • Συλλογή και προετοιμασία δεδομένων (data collection & parsing)
    • Ανάλυση απόψεων και συναισθημάτων Ι (opinion mining & sentiment analysis)
    • Ανάλυση απόψεων και συναισθημάτων ΙΙ
    • Αξιολόγηση και Περίληψη (evaluation & summarization)
  4. Εφαρμογή Μάρκετινγκ 2: Ομαδοποίηση κειμένων (document clustering)
    (Διάρκεια Θεματικής Ενότητας: 1 εβδομάδα)
    • Συλλογή και προετοιμασία δεδομένων (data collection & parsing)
    • Εφαρμοσμένη ομαδοποίηση διαφορετικών ειδών δεδομένων
  5. Εφαρμογή Text Mining 3: Κατηγοριοποίηση κειμένων (document classification)
    (Διάρκεια Θεματικής Ενότητας: 1 εβδομάδα)
    • Συλλογή και προετοιμασία δεδομένων (data collection & parsing)
    • Εφαρμοσμένη κατηγοριοποίηση διαφορετικών ειδών κειμένων
  6. Εφαρμογή Μάρκετινγκ 4: Εξόρυξη Περιγραφικών Λέξεων (Tag Extraction)
    (Διάρκεια Θεματικής Ενότητας: 1 εβδομάδα) Συλλογή και προετοιμασία δεδομένων (data collection & parsing), Εξόρυξη περιγραφικών λέξεων (tag extraction) από περιγραφές προϊόντων.
Εκπαιδευτικό υλικό
  • Python Scripts (με εσωτερικά σχόλια) για κάθε μια από τις ενότητες του προγράμματος
  • Εικονοσκοπημένες διαλέξεις που θα συνοδεύουν τα Scripts.
  • Ηλεκτρονικές σημειώσεις και βιβλιογραφία
  • Πλήθος διαδραστικών ασκήσεων, ερωτήσεις πολλαπλής επιλογής και λυμένες ασκήσεις
Η αξία του προγράμματος
Μέσα από το παρόν εκπαιδευτικό πρόγραμμα, οι εκπαιδευόμενοι θα μάθουν πως να χρησιμοποιούν την Python για να εξάγουν και να αξιοποιούν τις πληροφορίες αυτές από διάφορα είδη δεδομένων κειμένου.
Μέθοδοι αξιολόγησης και υπολογισμού τελικού βαθμού
Υποβολή εργασιών ανά θεματική ενότητα. Η επιτυχημένη ολοκλήρωση του προγράμματος και η απονομή πιστοποιητικού κατάρτισης απαιτούν την λήψη τελικού βαθμού τουλάχιστον 50%.
Διαβάστε περισσότερα για το πρόγραμμα

Άλλα επιμορφωτικά σεμινάρια με θεματολογία  με πιστοποίηση

Ανάλυση Δεδομένων και Προγραμματισμός σε Python 3

Σύντομη περιγραφή προγράμματος Η Python είναι μια ιδιαίτερα δημοφιλής γλώσσα γενικού προγραμματισμού με εφαρμογή κυρίως στην επιστήμη των δεδομένων. Οι εταιρείες την χρησιμοποιούν για να συλλέξουν πληροφορίες από τα δεδομένα τους και να αποκτήσουν ανταγωνιστικό πλεονέκτημα. Το πρόγραμμα απευθύνεται σε […]

Ανάπτυξη Web εφαρμογών με HTML, CSS, JavaScript, jQuery, AJAX και Bootstrap, UX-UI Design και Drupal

Σύντομη περιγραφή προγράμματος Οι Web τεχνολογίες αποτελούν αναπόσπαστο κομμάτι της κοινωνικής και οικονομικής ανάπτυξης στον 21ο αιώνα με αποτέλεσμα τη μεγάλη ζήτηση ανθρώπινου δυναμικού με τις παραπάνω γνώσεις και δεξιότητες. Το πρόγραμμα είναι μοναδικό στην Ελλάδα και διεθνώς γιατί το […]

Java Full Stack Web Programming με Java Enterprise Edition, Hibernate και Spring

Σύντομη περιγραφή προγράμματος Η Java Enterprise Edition (πλέον Jakarta EE) σε συνδυασμό με τις τεχνολογίες Hibernate, Spring και Web Programming χρησιμοποιούνται από τις μεγαλύτερες εταιρίες στον κόσμο για την ανάπτυξη ολοκληρωμένων Full Stack εφαρμογών. Το πρόγραμμα είναι το μοναδικό πρόγραμμα […]

Περισσότερα πιστοποιημένα προγράμματα από το

Ανάλυση Πληροφοριών

Σύντομη περιγραφή προγράμματος Το σημερινό περιβάλλον (οικονομικό, επιχειρηματικό, πολιτικό) χαρακτηρίζεται από πολυπλοκότητα και ύπαρξη μεγάλου όγκου πληροφοριών, η μη κατανόηση των οποίων οδηγεί σε λανθασμένες επιλογές με ανυπολόγιστο κόστος. Οι πιο επιτυχημένοι οργανισμοί και επιχειρήσεις χαρακτηρίζονται από την πλήρη ανάλυση […]

Tailor Made Negotiations

Σύντομη περιγραφή προγράμματος Με το πρόγραμμα Tailor Made Negotiations καλύπτεται όλο το φάσμα της διαπραγματευτικής δραστηριότητας, δηλαδή σύμφωνα με την πορεία του διαπραγματευτικού επεισοδίου: Το όραμα Τη μοντελοποίηση Τη Στρατηγική Τις τακτικές και Τις πρακτικές Η μοντελοποίηση επικεντρώνεται σε όλες […]

Ανάλυση Δεδομένων με τη Χρήση της R

Σύντομη περιγραφή προγράμματος Το πρόγραμμα αυτό προσφέρει μια εισαγωγή στην R, μια γρήγορη διδασκαλία βασικών στατιστικών εννοιών και μεθοδολογιών και στη συνέχεια προσφέρει τρόπους χρήσης της R για τη στατιστική ανάλυση δεδομένων έχοντας πάντα υπόψη τις εφαρμογές αλλά και σύγχρονα […]

Προτεινόμενα μοριοδοτούμενα σεμινάρια με πιστοποίηση πανεπιστημίων 

Πιστοποίηση στα εργαλεία της Google 2022 με μονάδες ECTS μέσω ΚΕΔΙΒΙΜ του πανεπιστημίου Θεσσαλίας

Μοριοδοτούμενο σεμινάριο επιμόρφωσης με πιστοποίηση από το πανεπιστήμιο Θεσσαλίας για τοπικές επιχειρήσεις

Κατακτώντας τη δύναμη του Excel: Ένα πολύτιμο εργαλείο στο εργασιακό περιβάλλον

Μοριοδοτούμενο σεμινάριο επιμόρφωσης excel με πιστοποίηση από το πανεπιστήμιο Θεσσαλίας

Dexiotites.gr

Copyright © 2021 - 2022 Company. All rights reserved | Created by AtMedia.gr
share-square-o linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram