<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
	<channel>
		<title>Llm on makhal.fr</title>
		<link>https://makhal.fr/tags/llm/</link>
		<description>Recent content in Llm on makhal.fr</description>
		<generator>Hugo</generator>
		<language>fr-fr</language>
		
		
		
		
			<lastBuildDate>Mon, 27 Apr 2026 08:40:45 +0200</lastBuildDate>
		
			<atom:link href="https://makhal.fr/tags/llm/index.xml" rel="self" type="application/rss+xml" />
			<item>
				<title>L&#39;inférence, c&#39;est un problème de mémoire</title>
				<link>https://makhal.fr/posts/docs/inference/linference-cest-un-probleme-memoire/</link>
				<pubDate>Mon, 27 Apr 2026 08:40:45 +0200</pubDate>
				<guid>https://makhal.fr/posts/docs/inference/linference-cest-un-probleme-memoire/</guid>
				<description>Et si la source de tous nos problemes n&amp;rsquo;est pas le computing qu&amp;rsquo;on dispose, mais la mémoire ? On decouvre ce que c&amp;rsquo;est la VRAM et compagnie</description>
			</item>
			<item>
				<title>C&#39;est quoi l&#39;inférence ?</title>
				<link>https://makhal.fr/posts/docs/inference/intro-a-linference/</link>
				<pubDate>Mon, 20 Apr 2026 08:40:45 +0200</pubDate>
				<guid>https://makhal.fr/posts/docs/inference/intro-a-linference/</guid>
				<description>On découvre la deuxième vie d&amp;rsquo;un modèle IA, l&amp;rsquo;inférence, et les enjeux qui y sont liés.</description>
			</item>
			<item>
				<title>Fini OpenAI : LLM maison sur un GPU</title>
				<link>https://makhal.fr/posts/docs/uppa/evaruntime/</link>
				<pubDate>Tue, 14 Apr 2026 08:40:45 +0200</pubDate>
				<guid>https://makhal.fr/posts/docs/uppa/evaruntime/</guid>
				<description>On a remplacé l&amp;rsquo;API OpenAI pour tout un labo universitaire. Coût : un GPU de 30W et zéro dépendance cloud.</description>
			</item>
	</channel>
</rss>
