Expert 2 Dagen Gratis

Bouw je eigen LLM Chatbot

Leer hoe je zonder complexe code een krachtige AI-chatbot bouwt. We gebruiken moderne 'No-Code' tools zoals Flowise om Large Language Models te koppelen aan je eigen data (RAG).

Leer hoe je zonder complexe code een krachtige AI-chatbot bouwt. We gebruiken moderne 'No-Code' tools zoals Flowise om Large Language Models te koppelen aan je eigen data (RAG). Module 1: De Anatomie van een Moderne Chatbot. Module 2: Flowise & Visueel Bouwen (+ Video). Module 3: RAG (Masterclass Data Koppelen). Module 4: Deployment & De Volgende Stappen.

Modules

Module 1: De Anatomie van een Moderne Chatbot ▼

Van Script naar Intelligentie

Traditionele chatbots (zoals je die kent van klantenservices uit 2015) werkten met beslisbomen: "Als de gebruiker 'retour' typt, toon dan pagina X." Dit is rigide en frustrerend. Een LLM-chatbot werkt fundamenteel anders. Hij 'begrijpt' de intentie en genereert een antwoord on-the-fly.

De 4 Pilaren van een AI App

Om een werkende applicatie te bouwen, heb je vier kerncomponenten nodig die samenwerken in een ketting (Chain):

Het Model (LLM): Het brein. Dit kan GPT-4 zijn, maar ook Claude 3.5 of een open-source model zoals Llama 3. Het model voorspelt het volgende woord. Belangrijke instelling hier is de Temperature: 0 is feitelijk en deterministisch, 0.7 tot 1.0 is creatief en gevarieerd.
De Prompt Template (System Prompt): De instructies. Zonder sturing is een LLM een ongeleid projectiel. In de 'System Prompt' definieer je de persoonlijkheid en regels.
Voorbeeld: "Je bent een behulpzame klantenservice medewerker van Coolblue. Je antwoordt altijd kort, bondig en met een grapje. Als je het antwoord niet weet, zeg je dat eerlijk."
Geheugen (Memory): LLM's zijn 'stateless'. Ze weten bij vraag 2 niet meer wat je bij vraag 1 vroeg. Om een gesprek te voeren, moeten we de chatgeschiedenis meesturen. We gebruiken vaak een Buffer Memory of Window Memory (onthoud de laatste K berichten) om te voorkomen dat we de limiet van het model bereiken.
Tools & Kennis (Optioneel): Standaard modellen weten niets van het heden of jouw privégegevens. Via tools kunnen we ze toegang geven tot Google Search, een calculator, of je eigen database (RAG).

Visuele Architectuur

De LLM Conversational Chain

User Input
"Hoe duur is X?"

Chat History
(Geheugen)

➡

Prompt Template
Injecteer instructies

➡

LLM
Process & Generate

➡

Output
Antwoord

Quiz - Module 1: De Anatomie van een Moderne Chatbot

1. Welk component zorgt ervoor dat de chatbot weet wat je eerder hebt gezegd?

Prompt Template

LLM

Memory (Geheugen)

Output Parser

2. Wat doet de 'Temperature' instelling?

Het regelt de koeling van de server

Het bepaalt de mate van creativiteit en willekeur in het antwoord

Het bepaalt de lengte van de tekst

Het bepaalt de taal van de tekst

3. Waarom is een System Prompt belangrijk?

Het maakt de AI sneller

Het geeft de AI zijn rol, regels en persoonlijkheid

Het is verplicht door wetgeving

Het zorgt voor betere spelling

Module 2: Flowise & Visueel Bouwen (+ Video) ▼

De Opkomst van No-Code AI

Frameworks zoals LangChain hebben het ontwikkelen van AI enorm krachtig gemaakt, maar vereisen veel code. Flowise is een open-source 'UI wrapper' om LangChain heen. Het maakt AI-development toegankelijk voor iedereen: je sleept blokjes (Nodes) en verbindt ze als Lego.

Aan de slag met Flowise

Je kunt Flowise lokaal draaien (via Node.js of Docker) of gehost in de cloud (bijv. via Railway of Render). De interface bestaat uit een leeg canvas waar je jouw logica uittekent.

Video Tutorial: In 3 Minuten een Werkende Bot

In deze video zie je hoe we binnen enkele minuten een volledig functionele chatbot opzetten die is gekoppeld aan de OpenAI API, inclusief geheugen.

▶

Het Bouwproces Stap-voor-Stap

Kies je Chain: Voor een simpele chat begin je meestal met een 'Conversation Chain' of 'LLM Chain'.
Selecteer je Model: Sleep een 'ChatOpenAI' node naar het canvas. Hier vul je je API key in en kies je het model (bijv. gpt-4o).
Voeg Geheugen toe: Zonder geheugen is elke vraag nieuw. Koppel een 'Buffer Memory' node aan de Chain zodat hij het gesprek onthoudt.
Prompting: Koppel een 'Prompt Template' node als je de persoonlijkheid wilt aanpassen. Gebruik variabelen zoals {history} en {input} in je template.

Druk op het groene 'Save' icoon en vervolgens op de chat-bubbel rechtsboven om direct te testen!

Quiz - Module 2: Flowise & Visueel Bouwen (+ Video)

1. Op welk populair code-framework is Flowise gebaseerd?

TensorFlow

LangChain

React

Laravel

2. Welk onderdeel is essentieel om een gesprek gaande te houden?

Buffer Memory

Een GPU

Een Vector Store

Een PDF lader

3. Wat is een 'Node' in de context van Flowise?

Een programmeerfout

Een functioneel blokje (bijv. een model, tool of bestand) dat je op het canvas sleept

Een server in een datacenter

Een gebruiker

Module 3: RAG (Masterclass Data Koppelen) ▼

Het Probleem: Hallucinaties en Kennisgaten

Een standaard LLM is gelimiteerd tot zijn trainingsdata (die vaak maanden oud is). Hij kent jouw bedrijf, jouw handleidingen of jouw klantdata niet. Als je ernaar vraagt, gaat hij gokken (hallucineren). De oplossing hiervoor heet RAG: Retrieval Augmented Generation.

Hoe werkt RAG? (Deep Dive)

In plaats van het model opnieuw te trainen (wat duur en traag is), bouwen we een slimme zoekmachine naast het model. Dit proces bestaat uit 3 fases:

Fase 1: Ingestion (Data Verwerken)

We pakken jouw PDF's, Word-documenten of webpagina's. Omdat computers en LLM's limieten hebben, moeten we deze tekst opknippen in kleine, behapbare stukjes. Dit noemen we Chunking. We gebruiken hiervoor een Recursive Character Text Splitter, die probeert alinea's logisch bij elkaar te houden.

Fase 2: Storage (Embeddings & Vector Stores)

Hier gebeurt de magie. We zetten die stukjes tekst (chunks) om in lange reeksen getallen: Embeddings. In deze wiskundige ruimte staan woorden met vergelijkbare betekenis dicht bij elkaar. 'Hond' staat dichter bij 'Kat' dan bij 'Broodrooster'.
Deze getallen slaan we op in een Vector Database (zoals Pinecone, Weaviate of een lokale in-memory store).

Fase 3: Retrieval & Generation (Het Antwoord)

Als de gebruiker een vraag stelt, gebeurt het volgende:

We zetten de vraag ook om in getallen (Embedding).
We zoeken in de database naar stukjes tekst die wiskundig het dichtst bij de vraag liggen (Semantic Search).
We sturen de vraag + de gevonden stukjes tekst naar het LLM met de instructie: "Gebruik alleen onderstaande context om de vraag te beantwoorden."

De RAG Pipeline

📄

1. Document Loader
Laad PDF/Tekst

➡

2. Splitter
Maak Chunks

🔢

3. Embeddings Model
Tekst naar Vectoren

➡

4. Vector Store
Opslag & Index

🤖

5. Retrieval
Zoek relevante context

➡

6. LLM Generatie
Antwoord + Bronvermelding

Quiz - Module 3: RAG (Masterclass Data Koppelen)

1. Wat is het doel van 'Chunking'?

De tekst onleesbaar maken

Grote teksten opdelen in kleine, betekenisvolle blokken voor verwerking

De bestandsgrootte vergroten

Tekst vertalen naar Engels

2. Wat zijn 'Embeddings'?

Plaatjes in een website

Numerieke representaties van de betekenis van tekst (vectoren)

Een type lettertype

programmeercode

3. Wat gebeurt er bij 'Semantic Search'?

Er wordt alleen gezocht op exacte trefwoorden

Er wordt gezocht op betekenis en context, niet alleen op trefwoorden

Er wordt gezocht op Google

De zoekopdracht wordt verwijderd

Module 4: Deployment & De Volgende Stappen ▼

Van Flowise naar Productie

Het bouwen van een chatbot is leuk, maar hij moet uiteindelijk waarde leveren voor gebruikers. Flowise maakt deployment (publicatie) verrassend eenvoudig. Je hebt geen complexe backend of serverkennis nodig om te starten.

Embedden op je Website

Flowise genereert automatisch een stukje Javascript code. Dit werkt als een 'widget'. Je plakt dit in de <body> of <head> van je website (WordPress, Wix, Shopify of HTML). De chatbubbel verschijnt direct en je kunt de kleuren, logo's en welkomstberichten aanpassen in de instellingen.

// Voorbeeld Embed Code
<script type="module">
  import Chatbot from "https://cdn.jsdelivr.net/npm/flowise-embed/dist/web.js"
  Chatbot.init({
    chatflowid: "b8a9c2d1-...",
    apiHost: "https://jouw-flowise-instantie.railway.app",
    theme: {
        button: { backgroundColor: "#3B81F6" },
        chatWindow: { welcomeMessage: "Hoi! Hoe kan ik helpen?" }
    }
  })
</script>

API Integratie

Wil je de chatbot gebruiken in WhatsApp, Slack of je eigen software? Gebruik dan de API endpoints. Flowise gedraagt zich als een backend server. Je stuurt een POST request met de vraag (JSON) en krijgt het antwoord terug.

De Toekomst: Agents & Tools

Je hebt nu een 'passieve' chatbot gebouwd (hij antwoordt op vragen). De volgende stap is het bouwen van Agents. Agents kunnen acties uitvoeren. Denk aan:

Een afspraak in je Google Calendar zetten.
Een e-mail versturen.
De actuele voorraad checken in een database.
Het internet afstruinen naar nieuws.

Dit vereist 'Tool Calling' en maakt de AI een actieve assistent in plaats van alleen een vraagbaak.

Quiz - Module 4: Deployment & De Volgende Stappen

1. Wat moet je doen om de chatbot op je website te krijgen?

Een nieuwe server kopen

De gegenereerde Javascript Embed code in je HTML plakken

Een brief sturen naar OpenAI

Je website offline halen

2. Wat is het verschil tussen een standaard Chatbot en een Agent?

Een Agent is duurder

Een Agent kan acties uitvoeren (Tools gebruiken) in de echte wereld, een Chatbot geeft alleen tekst

Een Agent is een mens

Er is geen verschil

3. Kan Flowise communiceren met andere apps zoals WhatsApp?

Nee, alleen websites

Ja, via de API endpoints

Alleen via fax

Alleen als je Microsoft gebruikt

Examen: Bouw je eigen LLM Chatbot

Beantwoord minimaal 80% van de vragen correct om je certificaat te ontvangen (20 vragen, minimaal 16 goed).

Je naam (voor op het certificaat):

1. Wat is een 'Node' in Flowise?

Een programmeerfout

Een bouwblokje met een specifieke functie (zoals een model of geheugen)

Een type pasta

Een server

2. Wat is het doel van 'Embeddings'?

Tekst vertalen naar wiskundige vectoren zodat computers betekenis kunnen vergelijken

Tekst dikgedrukt maken

Plaatjes invoegen

Video's afspelen

3. Welke tool is 'No-Code'?

Python

Flowise

C++

Assembly

4. Wat betekent RAG?

Robot AI Game

Retrieval Augmented Generation

Real Artificial Gen

Read All Goods

5. Wat is een 'Vector Database'?

Een database voor plaatjes

Een database gespecialiseerd in het opslaan en doorzoeken van embeddings (getallenreeksen)

Een Excel sheet

Een lijst met namen

6. Waarom heeft een chatbot 'Geheugen' (Memory) nodig?

Om te onthouden wie de president is

Om context te behouden over meerdere beurten in een gesprek

Om bestanden op te slaan

Om sneller te rekenen

7. Wat is de functie van een Prompt Template in een Flow?

De kleur bepalen

De input van de gebruiker samenvoegen met instructies voor het model

De database wissen

Het internet uitschakelen

8. Met welke techniek voeg je je eigen data toe aan een LLM?

Fine-tuning (soms) of RAG (meestal)

Ctrl+C Ctrl+V

Dat kan niet

Door hard tegen het scherm te praten

9. Wat is een 'Chain'?

Een kettingzaag

Een reeks van opeenvolgende stappen/nodes die data aan elkaar doorgeven

Een type database

Een beveiligingssleutel

10. Wat doet een 'Text Splitter'?

Tekst in kleine, behapbare stukjes hakken voor verwerking

Tekst verwijderen

Tekst vertalen

Tekst voorlezen

11. Is Flowise Open Source?

Nee

Alleen op dinsdag

Weet ik niet

12. Wat is de input van een LLM Chain meestal?

Een afbeelding

Een SQL query

De vraag van de gebruiker (User Input)

Een getal

13. Waarvoor gebruik je een API Key (bijv. van OpenAI)?

Om gratis pizza te bestellen

Om je te authenticeren en toegang te krijgen tot het model

Om de kleur te veranderen

Als wachtwoord voor je email

14. Wat gebeurt er als je geen geheugen toevoegt aan je flow?

De bot wordt boos

De bot vergeet na elke vraag wat er daarvoor gezegd is

De bot werkt niet

De bot wordt heel traag

15. Wat is 'Temperature' instelling in een LLM node?

Hoe warm de server wordt

De mate van willekeur/creativiteit in het antwoord

De taalinstelling

Het volume

16. Hoe zet je een Flowise bot op je site?

Via een Embed code / Script tag

Door de broncode te downloaden

Via een floppy disk

Niet mogelijk

17. Wat is Pinecone of Weaviate?

Soorten ijs

Vector Databases

LLM Modellen

Programmeertalen

18. Wat is het voordeel van No-Code?

Je kunt sneller bouwen en prototypen zonder diepgaande kennis van syntax

Het is altijd sneller dan coderen

Het is gratis

Je hebt geen computer nodig

19. Wat betekent 'Hallucinatie' bij een chatbot?

Dat hij feiten verzint

Dat hij droomt

Dat hij crasht

Dat hij plaatjes maakt

20. Kun je met Flowise ook PDF's uploaden?

Ja, via Document Loaders

Nee, alleen tekst

Alleen Excel

Alleen plaatjes