Thanks for the active participation and great feedback! Here you can find the slides of my talk “Software Analytics for Practitioners” at JAX 2018 (mostly in German) as well as a place for further discussions and feedback.
Title
Software Analytics für Praktiker (“Software Analytics for Practitioners” in English)
Abstract
German only:
Grundlegende Probleme in altgedienten Anwendungen managementgerecht zu kommunizieren, ist eine schwierige Sache. Wir haben jedoch fast alles, was wir dafür brauchen, vor uns liegen: Eine umfangreiche, wertvolle Datenbasis aus Tickets, Commits, Quellcode, Logdateien und vielem mehr. In der Session stelle ich Software Analytics vor, dessen Vorgehen und Methoden darauf abzielen, die Daten aus der Softwareentwicklung so aufzubereiten, dass sie von Managern zur Entscheidungsfindung herangezogen werden können. Ich zeige auch eine Werkzeugkette (Jupyter, Python, pandas, jQAssistant, Neo4j, D3), mit der sich Analysen von Java-Anwendungen und deren Umgebung (Git, FindBugs, JaCoCo, Profiler, Logfiles etc.) in der Praxis einfach umsetzen lassen. Als Beispiele sehen wir uns die Identifikation von wertlosem Code, die Aufdeckung von Wissenslücken und die Optimierung des fachlichen Schnitts einer Anwendung an.
Slides
If you couldn’t make it (or don’t speak German), there is a very early version of my talk on YouTube in English.
Demos
Here are the demos that I’ve shown:
- Identifying knowledge loss in the Linux kernel
- Spotting worthless code / portfolio analysis
- Optimizing business subdomains
Also, see my GitHub repository or blog for other data analysis in software development.
Update: I’ve just put a mini-tutorial on GitHub. You also see it live with mybinder.org (alpha version).
Further information
Literature
- Adam Tornhill: Software Design X-Ray
- Wes McKinney: Python For Data Analysis
- Christian Bird, Tim Menzies, Thomas Zimmermann: The Art and Science of Analyzing Software Data
- Tim Menzies, Laurie Williams, Thomas Zimmermann: Perspectives on Data Science for Software Engineering
Software
- Python Data Science Distribution: anaconda.com
- My repo: github.com/feststelltaste/software-analytics
- jQAssistant Getting Started Project: github.com/buschmais/spring-petclinic
Questions and Answers
Please leave any questions or feedback in the comments! I’ll answer them as soon as possible!
Thank you for sharing the slides. I participated the session at JAX which I liked. It is a very interesting topic and a very good starting point for own analyze.