en

Hosting git

August 2024

Vor 15 Jahren bin ich von Sourceforce auf GitHub umgestiegen. Projekte auf GitHub zu veröffentlichen war immer reibungslos und einfach. GitHub hat so mit meinem Code und dem von vielen anderen Entwicklern einen beachtlichen Datenschatz zusammengetragen. Es freut mich, dass einzelne meiner Repos Teil des GitHub Archive Program sind. Das Archive Program hat tausende von Repositories in Norwegen in einer alten Kohlemiene eingelagert. Laut dem Archive Program haltbar für die nächsten 1.000 Jahre. Dafür bin ich GitHub dankbar.

Mit dem Rennen um Datentöpfe für LLM-Trainings ist GitHub so zu einer Goldmiene für all jene geworden, die sich Cluster aus tausenden von nVidia A100-Grafikkarten leisten können. Leider sind das Training und die produzierten Modelle nicht so transparent wie die genutzten Open Source Projekte. Und Mustafa Suleyman, CEO von Microsoft AI, hält das ganze Internet für freeware. Da passt es ganz gut, dass Microsoft eigene Modelle trainiert und gleichzeitig der Besitzer von GitHub ist. Zumindest aus Sicht von Microsoft…

Es ist eigentlich gar nicht so schwer selbst einen git-Server zu betreiben. Die git Binary bringt diesen sogar schon mit. Dann noch einen DNS Eintrag und einen HTML-Index und man hat sein eigenes Hosting:

git.ma300k.de

Ich habe begonnen einzelne Projekte von GitHub abzuziehen und auf meinem eigenen Server zu veröffentlichen. Für die Crawler auf der Suche nach neuem Content zum Training sind sie dadurch natürlich immer noch erreichbar. Ich glaube es gibt mir nur das Gefühl etwas mehr wieder selbst in der Hand zu halten.

Feedback

Falls der Artikel interessant war oder etwas unklar ist freue ich mich über Fragen per e-Mail an markus.peroebner@gmail.com.