Expert 2 Dagen Gratis

Bouw je eigen LLM Chatbot

Leer hoe je zonder complexe code een krachtige AI-chatbot bouwt. We gebruiken moderne 'No-Code' tools zoals Flowise om Large Language Models te koppelen aan je eigen data (RAG).

Leer hoe je zonder complexe code een krachtige AI-chatbot bouwt. We gebruiken moderne 'No-Code' tools zoals Flowise om Large Language Models te koppelen aan je eigen data (RAG). Module 1: De Anatomie van een Moderne Chatbot. Module 2: Flowise & Visueel Bouwen (+ Video). Module 3: RAG (Masterclass Data Koppelen). Module 4: Deployment & De Volgende Stappen.

Modules

Module 1: De Anatomie van een Moderne Chatbot

Van Script naar Intelligentie

Traditionele chatbots (zoals je die kent van klantenservices uit 2015) werkten met beslisbomen: "Als de gebruiker 'retour' typt, toon dan pagina X." Dit is rigide en frustrerend. Een LLM-chatbot werkt fundamenteel anders. Hij 'begrijpt' de intentie en genereert een antwoord on-the-fly.

De 4 Pilaren van een AI App

Om een werkende applicatie te bouwen, heb je vier kerncomponenten nodig die samenwerken in een ketting (Chain):

  1. Het Model (LLM): Het brein. Dit kan GPT-4 zijn, maar ook Claude 3.5 of een open-source model zoals Llama 3. Het model voorspelt het volgende woord. Belangrijke instelling hier is de Temperature: 0 is feitelijk en deterministisch, 0.7 tot 1.0 is creatief en gevarieerd.
  2. De Prompt Template (System Prompt): De instructies. Zonder sturing is een LLM een ongeleid projectiel. In de 'System Prompt' definieer je de persoonlijkheid en regels.
    Voorbeeld: "Je bent een behulpzame klantenservice medewerker van Coolblue. Je antwoordt altijd kort, bondig en met een grapje. Als je het antwoord niet weet, zeg je dat eerlijk."
  3. Geheugen (Memory): LLM's zijn 'stateless'. Ze weten bij vraag 2 niet meer wat je bij vraag 1 vroeg. Om een gesprek te voeren, moeten we de chatgeschiedenis meesturen. We gebruiken vaak een Buffer Memory of Window Memory (onthoud de laatste K berichten) om te voorkomen dat we de limiet van het model bereiken.
  4. Tools & Kennis (Optioneel): Standaard modellen weten niets van het heden of jouw privégegevens. Via tools kunnen we ze toegang geven tot Google Search, een calculator, of je eigen database (RAG).

Visuele Architectuur

De LLM Conversational Chain
User Input
"Hoe duur is X?"
+
Chat History
(Geheugen)
Prompt Template
Injecteer instructies
LLM
Process & Generate
Output
Antwoord

Quiz - Module 1: De Anatomie van een Moderne Chatbot

1. Welk component zorgt ervoor dat de chatbot weet wat je eerder hebt gezegd?

Prompt Template
LLM
Memory (Geheugen)
Output Parser

2. Wat doet de 'Temperature' instelling?

Het regelt de koeling van de server
Het bepaalt de mate van creativiteit en willekeur in het antwoord
Het bepaalt de lengte van de tekst
Het bepaalt de taal van de tekst

3. Waarom is een System Prompt belangrijk?

Het maakt de AI sneller
Het geeft de AI zijn rol, regels en persoonlijkheid
Het is verplicht door wetgeving
Het zorgt voor betere spelling
Module 2: Flowise & Visueel Bouwen (+ Video)

De Opkomst van No-Code AI

Frameworks zoals LangChain hebben het ontwikkelen van AI enorm krachtig gemaakt, maar vereisen veel code. Flowise is een open-source 'UI wrapper' om LangChain heen. Het maakt AI-development toegankelijk voor iedereen: je sleept blokjes (Nodes) en verbindt ze als Lego.

Aan de slag met Flowise

Je kunt Flowise lokaal draaien (via Node.js of Docker) of gehost in de cloud (bijv. via Railway of Render). De interface bestaat uit een leeg canvas waar je jouw logica uittekent.

Video Tutorial: In 3 Minuten een Werkende Bot

In deze video zie je hoe we binnen enkele minuten een volledig functionele chatbot opzetten die is gekoppeld aan de OpenAI API, inclusief geheugen.

Video Tutorial

Het Bouwproces Stap-voor-Stap

  1. Kies je Chain: Voor een simpele chat begin je meestal met een 'Conversation Chain' of 'LLM Chain'.
  2. Selecteer je Model: Sleep een 'ChatOpenAI' node naar het canvas. Hier vul je je API key in en kies je het model (bijv. gpt-4o).
  3. Voeg Geheugen toe: Zonder geheugen is elke vraag nieuw. Koppel een 'Buffer Memory' node aan de Chain zodat hij het gesprek onthoudt.
  4. Prompting: Koppel een 'Prompt Template' node als je de persoonlijkheid wilt aanpassen. Gebruik variabelen zoals {history} en {input} in je template.

Druk op het groene 'Save' icoon en vervolgens op de chat-bubbel rechtsboven om direct te testen!

Quiz - Module 2: Flowise & Visueel Bouwen (+ Video)

1. Op welk populair code-framework is Flowise gebaseerd?

TensorFlow
LangChain
React
Laravel

2. Welk onderdeel is essentieel om een gesprek gaande te houden?

Buffer Memory
Een GPU
Een Vector Store
Een PDF lader

3. Wat is een 'Node' in de context van Flowise?

Een programmeerfout
Een functioneel blokje (bijv. een model, tool of bestand) dat je op het canvas sleept
Een server in een datacenter
Een gebruiker
Module 3: RAG (Masterclass Data Koppelen)

Het Probleem: Hallucinaties en Kennisgaten

Een standaard LLM is gelimiteerd tot zijn trainingsdata (die vaak maanden oud is). Hij kent jouw bedrijf, jouw handleidingen of jouw klantdata niet. Als je ernaar vraagt, gaat hij gokken (hallucineren). De oplossing hiervoor heet RAG: Retrieval Augmented Generation.

Hoe werkt RAG? (Deep Dive)

In plaats van het model opnieuw te trainen (wat duur en traag is), bouwen we een slimme zoekmachine naast het model. Dit proces bestaat uit 3 fases:

Fase 1: Ingestion (Data Verwerken)

We pakken jouw PDF's, Word-documenten of webpagina's. Omdat computers en LLM's limieten hebben, moeten we deze tekst opknippen in kleine, behapbare stukjes. Dit noemen we Chunking. We gebruiken hiervoor een Recursive Character Text Splitter, die probeert alinea's logisch bij elkaar te houden.

Fase 2: Storage (Embeddings & Vector Stores)

Hier gebeurt de magie. We zetten die stukjes tekst (chunks) om in lange reeksen getallen: Embeddings. In deze wiskundige ruimte staan woorden met vergelijkbare betekenis dicht bij elkaar. 'Hond' staat dichter bij 'Kat' dan bij 'Broodrooster'.
Deze getallen slaan we op in een Vector Database (zoals Pinecone, Weaviate of een lokale in-memory store).

Fase 3: Retrieval & Generation (Het Antwoord)

Als de gebruiker een vraag stelt, gebeurt het volgende:

  1. We zetten de vraag ook om in getallen (Embedding).
  2. We zoeken in de database naar stukjes tekst die wiskundig het dichtst bij de vraag liggen (Semantic Search).
  3. We sturen de vraag + de gevonden stukjes tekst naar het LLM met de instructie: "Gebruik alleen onderstaande context om de vraag te beantwoorden."
De RAG Pipeline
📄
1. Document Loader
Laad PDF/Tekst
2. Splitter
Maak Chunks
🔢
3. Embeddings Model
Tekst naar Vectoren
4. Vector Store
Opslag & Index
🤖
5. Retrieval
Zoek relevante context
6. LLM Generatie
Antwoord + Bronvermelding

Quiz - Module 3: RAG (Masterclass Data Koppelen)

1. Wat is het doel van 'Chunking'?

De tekst onleesbaar maken
Grote teksten opdelen in kleine, betekenisvolle blokken voor verwerking
De bestandsgrootte vergroten
Tekst vertalen naar Engels

2. Wat zijn 'Embeddings'?

Plaatjes in een website
Numerieke representaties van de betekenis van tekst (vectoren)
Een type lettertype
programmeercode

3. Wat gebeurt er bij 'Semantic Search'?

Er wordt alleen gezocht op exacte trefwoorden
Er wordt gezocht op betekenis en context, niet alleen op trefwoorden
Er wordt gezocht op Google
De zoekopdracht wordt verwijderd
Module 4: Deployment & De Volgende Stappen

Van Flowise naar Productie

Het bouwen van een chatbot is leuk, maar hij moet uiteindelijk waarde leveren voor gebruikers. Flowise maakt deployment (publicatie) verrassend eenvoudig. Je hebt geen complexe backend of serverkennis nodig om te starten.

Embedden op je Website

Flowise genereert automatisch een stukje Javascript code. Dit werkt als een 'widget'. Je plakt dit in de <body> of <head> van je website (WordPress, Wix, Shopify of HTML). De chatbubbel verschijnt direct en je kunt de kleuren, logo's en welkomstberichten aanpassen in de instellingen.

// Voorbeeld Embed Code
<script type="module">
  import Chatbot from "https://cdn.jsdelivr.net/npm/flowise-embed/dist/web.js"
  Chatbot.init({
    chatflowid: "b8a9c2d1-...",
    apiHost: "https://jouw-flowise-instantie.railway.app",
    theme: {
        button: { backgroundColor: "#3B81F6" },
        chatWindow: { welcomeMessage: "Hoi! Hoe kan ik helpen?" }
    }
  })
</script>
                    

API Integratie

Wil je de chatbot gebruiken in WhatsApp, Slack of je eigen software? Gebruik dan de API endpoints. Flowise gedraagt zich als een backend server. Je stuurt een POST request met de vraag (JSON) en krijgt het antwoord terug.

De Toekomst: Agents & Tools

Je hebt nu een 'passieve' chatbot gebouwd (hij antwoordt op vragen). De volgende stap is het bouwen van Agents. Agents kunnen acties uitvoeren. Denk aan:

  • Een afspraak in je Google Calendar zetten.
  • Een e-mail versturen.
  • De actuele voorraad checken in een database.
  • Het internet afstruinen naar nieuws.
Dit vereist 'Tool Calling' en maakt de AI een actieve assistent in plaats van alleen een vraagbaak.

Quiz - Module 4: Deployment & De Volgende Stappen

1. Wat moet je doen om de chatbot op je website te krijgen?

Een nieuwe server kopen
De gegenereerde Javascript Embed code in je HTML plakken
Een brief sturen naar OpenAI
Je website offline halen

2. Wat is het verschil tussen een standaard Chatbot en een Agent?

Een Agent is duurder
Een Agent kan acties uitvoeren (Tools gebruiken) in de echte wereld, een Chatbot geeft alleen tekst
Een Agent is een mens
Er is geen verschil

3. Kan Flowise communiceren met andere apps zoals WhatsApp?

Nee, alleen websites
Ja, via de API endpoints
Alleen via fax
Alleen als je Microsoft gebruikt

Examen: Bouw je eigen LLM Chatbot

Beantwoord minimaal 80% van de vragen correct om je certificaat te ontvangen (20 vragen, minimaal 16 goed).

1. Wat is een 'Node' in Flowise?

Een programmeerfout
Een bouwblokje met een specifieke functie (zoals een model of geheugen)
Een type pasta
Een server

2. Wat is het doel van 'Embeddings'?

Tekst vertalen naar wiskundige vectoren zodat computers betekenis kunnen vergelijken
Tekst dikgedrukt maken
Plaatjes invoegen
Video's afspelen

3. Welke tool is 'No-Code'?

Python
Flowise
C++
Assembly

4. Wat betekent RAG?

Robot AI Game
Retrieval Augmented Generation
Real Artificial Gen
Read All Goods

5. Wat is een 'Vector Database'?

Een database voor plaatjes
Een database gespecialiseerd in het opslaan en doorzoeken van embeddings (getallenreeksen)
Een Excel sheet
Een lijst met namen

6. Waarom heeft een chatbot 'Geheugen' (Memory) nodig?

Om te onthouden wie de president is
Om context te behouden over meerdere beurten in een gesprek
Om bestanden op te slaan
Om sneller te rekenen

7. Wat is de functie van een Prompt Template in een Flow?

De kleur bepalen
De input van de gebruiker samenvoegen met instructies voor het model
De database wissen
Het internet uitschakelen

8. Met welke techniek voeg je je eigen data toe aan een LLM?

Fine-tuning (soms) of RAG (meestal)
Ctrl+C Ctrl+V
Dat kan niet
Door hard tegen het scherm te praten

9. Wat is een 'Chain'?

Een kettingzaag
Een reeks van opeenvolgende stappen/nodes die data aan elkaar doorgeven
Een type database
Een beveiligingssleutel

10. Wat doet een 'Text Splitter'?

Tekst in kleine, behapbare stukjes hakken voor verwerking
Tekst verwijderen
Tekst vertalen
Tekst voorlezen

11. Is Flowise Open Source?

Ja
Nee
Alleen op dinsdag
Weet ik niet

12. Wat is de input van een LLM Chain meestal?

Een afbeelding
Een SQL query
De vraag van de gebruiker (User Input)
Een getal

13. Waarvoor gebruik je een API Key (bijv. van OpenAI)?

Om gratis pizza te bestellen
Om je te authenticeren en toegang te krijgen tot het model
Om de kleur te veranderen
Als wachtwoord voor je email

14. Wat gebeurt er als je geen geheugen toevoegt aan je flow?

De bot wordt boos
De bot vergeet na elke vraag wat er daarvoor gezegd is
De bot werkt niet
De bot wordt heel traag

15. Wat is 'Temperature' instelling in een LLM node?

Hoe warm de server wordt
De mate van willekeur/creativiteit in het antwoord
De taalinstelling
Het volume

16. Hoe zet je een Flowise bot op je site?

Via een Embed code / Script tag
Door de broncode te downloaden
Via een floppy disk
Niet mogelijk

17. Wat is Pinecone of Weaviate?

Soorten ijs
Vector Databases
LLM Modellen
Programmeertalen

18. Wat is het voordeel van No-Code?

Je kunt sneller bouwen en prototypen zonder diepgaande kennis van syntax
Het is altijd sneller dan coderen
Het is gratis
Je hebt geen computer nodig

19. Wat betekent 'Hallucinatie' bij een chatbot?

Dat hij feiten verzint
Dat hij droomt
Dat hij crasht
Dat hij plaatjes maakt

20. Kun je met Flowise ook PDF's uploaden?

Ja, via Document Loaders
Nee, alleen tekst
Alleen Excel
Alleen plaatjes