Zum Inhalt
Einführungs-Workshop in Python

Einführung in Python

Der Workshop "Einführung in Python" richtet sich insbesondere an Python-AnfängerInnen und es werden keine Python-Kenntnisse vorausgesetzt.

Zur Vorbereitung auf den Workshop empfehlen wir die vorherige Installation von Python inkl. einer Entwicklungsumgebung (IDE). Eine IDE ist ein Programm, mit der Sie Python-Programme schreiben und ausführen können. Im Workshop werden wir JupyterLab verwenden. Weiter untern auf der Seite erwähnen wir ein paar Möglichkeiten, wie Sie Python (für den Workshop) einfach nutzen können .

Verwendeter Python-Code und Datensatz

Allgemeines

  • Intro-Folien für den Workshop: Workshop-Folien
  • Tipp: Für die aktive Teilnahme am Workshop sind 2 Bildschirme vorteilhaft. Auf einem Bildschirm können Sie Zoom anzeigen und auf dem anderen Bildschirm können Sie selber programmieren

Code:

  • JupyterLab-Notebook Template (nur Kommentare, wird im Workshop Live mit Code gefüllt)
  • Vollständiges JupyterLab-Notebook
  • Hinweis: Die JupyterLab-Notebooks mit Rechtsklick und "Link speichern unter" herunterladen
  • Die JupyterLab-Notebooks sind unter der MIT Lizenz veröffentlicht (siehe unten)

Verwendeter Datensatz:

  • Wichtig: Damit das Programm funktioniert:
    • Sie benötigen alle 3 Datensätze (csv, xlsx und tab-csv [weiter unten]) 
    • die Datensätze und das JupyterLab-Notebook müssen im gleichen Ordner auf Ihrer Festplatte liegen!
  • Als .csv-Datei: Titanic Datensatz
  • Als .xlsx-Datei: Titanic Datensatz
  • Als tab-csv-Datei:Titanic-Datensatz-Tab 
  • Spalten-Überschriften
    • PassengerId: zugewiesene ID 
    • Survived: Überlebt 0/1
    • Pclass: Ticket-Kategorie First/Second/Third
    • Name: Nachname, Vorname
    • Sex: Geschlecht male/female
    • Age: Alter
    • SibSp: Anzahl Geschwister/Ehepartner an Bord
    • Parch: Anzahl Eltern/Kinder an Bord
    • Ticket: Ticket-Nummer
    • Fare: Ticket-Preis
    • Cabin: Kabinennummer
    • Embarked: Einstiegs-Hafen, C: Cherbourg, Q: Queenstown, S: Southampton
  • Hinweis: Die csv-Datei ist lizensiert unter CC0 1.0, veröffentlicht auf https://www.kaggle.com/datasets/yasserh/titanic-dataset
  • Die xlsx- und tab-csv-Datei wurden von Bernd Zey erzeugt und sind unter CC0 1.0 lizensiert

 

---

Der Code ist unter der MIT License zur Verfügung gestellt. 

Copyright (c) 2024 Bernd Zey 

Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software.

THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.

Python und Entwicklungsumgebungen

Online-Lösung

Eine einfache Möglichkeit, ohne Python lokal installieren zu müssen, ist die Nutzung von Online-Lösungen, wie z.B.:

  • https://jupyter.org/try-jupyter/lab/: hier haben Sie die Möglichkeit, auf der offziellen Seite JuypterLab temporär auszuprobieren (https://jupyter.org/try). Beachten Sie, dass Sie hier keine sensiblen Daten hochladen sollten. Hinweis: um z.B. eine Excel-Datei in Pandas laden zu können, müssen Sie vorher ein Modul mit Hilfe des Befehls "%pip install openpyxl" laden
  • https://colab.research.google.com: über Google Colab haben Sie ebenfalls die Möglichkeit, JupyterLab zu verwenden, um Python-Programme zu entwickeln. Hier kann der Browser eine Rolle spielen (bei mir hat Chrome gut funktioniert).

Lokale Installation

Um Python und eine IDE auf Ihrem lokalen PC zu installieren, möchten wir Ihnen im Folgenden zwei Möglichkeiten beschreiben:

  • Aus unserer Sicht ist der Einstieg mit Anaconda am einfachsten, da hier Python und einige IDEs direkt mitinstalliert werden und Sie mit dem Anaconda Navigator eine grafische Oberfläche haben. Leider ist Anaconda keine komplett freie Lösung. Von der offiziellen FAQ-Seite (englisch):
    • " free for individuals and small organizations, which is defined in the Terms of Service as having less than 200 employees or contractors" and "educational entities [...] when used in a course curriculum, including teaching, learning, and researching, at accredited universities worldwide".
    • Bitte beachten Sie diese Bedingungen vor der Nutzung von Anaconda und entscheiden Sie, ob Anaconda für Sie in Frage kommt
  • Eine Alternative zu Anaconda ist  Miniforge, durch das ebenfalls Python mit installiert wird, Sie allerdings keine grafische Oberfläche haben. Miniforge und der Standard-Channel für Pakete (conda-forge) sind frei nutzbar und haben nicht die Enschränkungen wie Anaconda

Wir beschreiben im Folgenden beide Möglichkeiten, Python und JupyterLab zu installieren.

Lokale Installation mit Anaconda
  • Anaconda ist eine Python-Distribution, die gleich mehre Entwicklungsumgebungen mitliefert, u.a. JupyterLab, Spyder und PyCharm. Diese sind über den integrierten Anaconda Navigator erreichbar. 
  • Eine Installations-Anleitung für Anaconda (auf Englisch) und die Installations-Datei für Windows finden Sie auf der Anaconda-Homepage: Installing on Windows — Anaconda documentation
  • Über den Anaconda Navigator können Sie die gewünschte IDE starten. Im Workshop arbeiten wir mit JupyterLab.
  • Zusätzlich zu der IDE benötigen wir in diesem Workshop das Paket Pandas. Wenn Sie Anaconda installiert haben, dann können Sie z.B. Jupyterlab starten und in einem neuen Notebook "import pandas" eingeben. Wenn sich die Zelle ohne Fehlermeldung ausführen lässt (über Shift+Enter oder den grünen Play-Knopf), ist alles in Ordnung und Sie sind für den Workshop vorbereitet. Falls Sie eine Fehlermeldung bekommen, dann müssen Sie noch das Paket Pandas installieren:
    • Falls Sie Jupyterlab und/oder Pandas installieren müssen, dann können Sie das bei Anaconda unter "Environments" machen. Dort findet sich rechts oben die Suche nach den Paketen. Wählen Sie "jupyterlab" bzw. "pandas" aus und wählen rechts unten "Apply". Folgen Sie den Installations-Hinweisen und bestätigen Sie eventuell notwendige zusätzliche Pakete. 
    • Tipp: legen Sie für den Worksop eine neue Umgebung (Environment) an und nutzen diese

Lokale Installation mit Miniforge
  • Installieren Sie Miniforge nach dem Download von https://conda-forge.org/download/
  • Im Vergleich zu Anaconda haben Sie keine grafische Oberfläche! Hier arbeiten Sie mit der "Miniforge Prompt", welche Sie über das Windows-Startmenü finden. Die Prompt ist eine Kommandozeile, in die Sie Ihre Befehle eingeben.
  • Starten Sie den "Miniforge Prompt": zuerst erstellen wir eine Umgebung (Environment) mit dem Befehl "conda create --name pythonWorkshop" wobei pythonWorkshop ein selbst gewählter passender Bezeichner ist, den Sie auch anders wählen können
    • Anschließend aktivieren Sie die Umgebung mit "conda activate pythonWorkshop"
    • Installieren Sie JupyterLab mit dem Befehl "conda install -c conda-forge jupyterlab"
    • Installieren Sie weitere benötigte Pakete mit
      • conda install pandas
      • conda install openpyxl
      • conda install matplotlib
  • In der Prompt können Sie nun JupyterLab starten, indem Sie "jupyter lab" eingeben. JupyterLab öffnet sich in einem Browser-Fenster

 

Entwicklungsumgebungen (IDEs)