Einführung in Python
Der Workshop "Einführung in Python" richtet sich insbesondere an Python-AnfängerInnen und es werden keine Python-Kenntnisse vorausgesetzt.
Zur Vorbereitung auf den Workshop empfehlen wir die vorherige Installation von Python inkl. einer Entwicklungsumgebung (IDE). Eine IDE ist eine App, mit der Sie Programme schreiben können.
Für den ersten Einstig empfehlen wir Anaconda, da hier Python und einige IDEs direkt mitinstalliert werden und Sie sich nicht extra um deren Installation kümmern müssen:
- Anaconda ist eine Python-Distribution, die gleich mehre Entwicklungsumgebungen mitliefert, u.a. JupyterLab, Spyder und PyCharm. Diese sind über den integrierten Anaconda Navigator erreichbar.
- Eine Installations-Anleitung für Anaconda (auf Englisch) und die Installations-Datei für Windows finden Sie auf der Anaconda-Homepage: Installing on Windows — Anaconda documentation
- Über den Anaconda Navigator können Sie die gewünschte IDE starten. Im Workshop arbeiten wir mit JupyterLab. Weiter unten auf dieser Seite finden Sie den Code in Form eines JupyterLab-Notebooks (Datei-Endung ".ipynb") .
- Anmerkung: Alle der unten genannten IDE's können auch über Anaconda installiert werden
Alternativ zu Anaconda (und z.B. JupyterLab) können Sie auch direkt Ihre gewünschte IDE installieren. Beachten Sie, dass Sie sich hierbei auch um die Installation von Python kümmern müssen. Im Folgenden 4 Beispiel-IDE's:
- JupyterLab. Eine ausführliche Installations-Anleitung finden Sie z.B. auf den Seiten der Universität Twente: Install JupyterLab on Windows — Geospatial computing platform's user manual documentation (utwente.nl). oder auf den offiziellen Github-Seiten von JupyterLab: GitHub - jupyterlab/jupyterlab-desktop: JupyterLab desktop application, based on Electron.
- VSCode (Visual Studio Code): Get Started Tutorial for Python in Visual Studio Code
- Spyder: Installation Guide — Spyder 5 documentation (spyder-ide.org)
- PyCharm: Install PyCharm | PyCharm Documentation (jetbrains.com)
Zusätzlich zu der IDE benötigen wir in diesem Workshop das Paket Pandas. Wenn Sie Anaconda installiert haben, dann können Sie z.B. Jupyterlab starten und in einem neuen Notebook "import pandas" eingeben. Wenn sich die Zelle ohne Fehlermeldung ausführen lässt (über Shift+Enter oder den grünen Play-Knopf), ist alles in Ordnung und Sie sind für den Workshop vorbereitet. Falls Sie eine Fehlermeldung bekommen, dann müssen Sie noch das Paket Pandas installieren:
- Falls Sie Jupyterlab und/oder Pandas installieren müssen, dann können Sie das bei Anaconda unter "Environments" machen. Dort findet sich rechts oben die Suche nach den Paketen. Wählen Sie "jupyterlab" bzw. "pandas" aus und wählen rechts unten "Apply". Folgen Sie den Installations-Hinweisen und bestätigen Sie eventuell notwendige zusätzliche Pakete.
Verwendeter Python-Code und Datensatz
Allgemeines
- Intro-Folien für den Workshop: Workshop-Folien
- Tipp: Für die aktive Teilnahme am Workshop sind 2 Bildschirme vorteilhaft. Auf einem Bildschirm können Sie Zoom anzeigen und auf dem anderen Bildschirm können Sie selber programmieren
Code:
- JupyterLab-Notebook Template (nur Kommentare, wird im Workshop Live mit Code gefüllt)
- Für die aktive Mitarbeit: JupyterLab-Notebook Template
- Vollständiges JupyterLab-Notebook
- Hinweis: Die JupyterLab-Notebooks mit Rechtsklick und "Link speichern unter" herunterladen
- Die JupyterLab-Notebooks sind unter der MIT Lizenz veröffentlicht (siehe unten)
Verwendeter Datensatz:
- Wichtig: Damit das Programm funktioniert:
- Sie benötigen alle 3 Datensätze (csv, xlsx und tab-csv [weiter unten])
- die Datensätze und das JupyterLab-Notebook müssen im gleichen Ordner auf Ihrer Festplatte liegen!
- Als .csv-Datei: Titanic Datensatz
- Als .xlsx-Datei: Titanic Datensatz
- Als tab-csv-Datei:Titanic-Datensatz-Tab
- Spalten-Überschriften
- PassengerId: zugewiesene ID
- Survived: Überlebt 0/1
- Pclass: Ticket-Kategorie First/Second/Third
- Name: Nachname, Vorname
- Sex: Geschlecht male/female
- Age: Alter
- SibSp: Anzahl Geschwister/Ehepartner an Bord
- Parch: Anzahl Eltern/Kinder an Bord
- Ticket: Ticket-Nummer
- Fare: Ticket-Preis
- Cabin: Kabinennummer
- Embarked: Einstiegs-Hafen, C: Cherbourg, Q: Queenstown, S: Southampton
- Hinweis: Die csv-Datei ist lizensiert unter CC0 1.0, veröffentlicht auf https://www.kaggle.com/datasets/yasserh/titanic-dataset
- Die xlsx- und tab-csv-Datei wurden von Bernd Zey erzeugt und sind unter CC0 1.0 lizensiert
---
Der Code ist unter der MIT License zur Verfügung gestellt.
Copyright (c) 2024 Bernd Zey
Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.