PNT Medical AI Platform - Hệ Thống AI Y Khoa

Các Dịch Vụ API

Hệ thống cung cấp 15 dịch vụ đang hoạt động với AI Agent trung tâm — 7 GPU services, 8 non-GPU services

AI Agent — Trợ Lý Tổng Hợp

AI Agent — Unified Assistant

NEW CPU Orchestrator

Trợ lý AI tổng hợp thông minh — tự động nhận biết ý định và điều phối đến đúng service: ASR, OCR, dịch thuật, tóm tắt, tìm kiếm mã y tế, TTS, bệnh nhân ảo và hơn thế nữa. Hỗ trợ hội thoại có lịch sử session, streaming WebSocket real-time.

pnt.badt.vn/ai_agent/ Port: 8099 8 services tích hợp WebSocket streaming Intent detection

API Docs Chi tiết Dùng Chatbot

GPU Services

Medical Transcribe

CRITICAL CVD=0 RTX 3060 #1 (v2) + CVD=4 RTX 3070 (Worker2)

Nhận dạng giọng nói y khoa tiếng Việt — 2 Workers + GPU Load Balancer, tối ưu tải real-time

pnt.badt.vn/medical_transcribe/ VRAM: 6.4GB/8GB Model: PhoWhisper

API Docs Chi tiết

Face Recognition

CVD=4 - RTX 3070

API nhận dạng khuôn mặt với độ chính xác cao

pnt.badt.vn/face_recognition/ VRAM: 243MB/12GB

API Docs Web App Chi tiết

Gemma 4 E4B Local LLM + Multimodal

NEW Primary LLM Vision+Audio CVD=2 - RTX 3060

Google Gemma 4 E4B — 29B tham số (AWQ 4-bit), context 4K (VRAM-limited), thinking mode, hỗ trợ tiếng Việt và 140+ ngôn ngữ. Hỗ trợ multimodal — nhận diện hình ảnh, video và audio qua API OpenAI-compatible — tối ưu cho phân tích hình ảnh y khoa (X-quang, CT, MRI) và suy luận lâm sàng.

pnt.badt.vn/gemma4/ (text) pnt.badt.vn/gemma4-mm/ (multimodal) Port: 8044 Gemma-4-E4B-it INT4 ~10GB VRAM ~40 tokens/sec

Hướng dẫn API Docs

GPU Agent

Monitor

Giám sát và quản lý tài nguyên 5 GPU trong thời gian thực — VRAM, utilization, nhiệt độ, điều phối workload

pnt.badt.vn/gpu-agent/ Port: 8050 CPU-only

API Docs Chi tiết

Qwen 2.5-7B LLM

Tool-calling CVD=3 - RTX 3060 #3

LLM Qwen2.5-7B-Instruct-AWQ — hỗ trợ tool calling, primary LLM của AI Agent, worker trong team mode cùng Gemma4 và Qwen3

pnt.badt.vn/qwen/ Port: 8043 Qwen2.5-7B-AWQ ~5GB VRAM

API Docs Chi tiết

medGemma 1.5 Multimodal (Y khoa)

NEW Medical AI CVD=1 - RTX 5060 Ti

Google medGemma 1.5 — 4B tham số, model y khoa multimodal chính thức từ Google. Hỗ trợ image+text input, chuyên biệt cho phân tích hình ảnh y khoa (X-quang, CT, MRI) và trả lời câu hỏi lâm sàng. OpenAI-compatible API, context 4K tokens, bfloat16. Chạy trên GPU RTX 5060 Ti 16GB.

pnt.badt.vn/medgemma/ Port: 8094 medgemma-1.5-4b-it Medical imaging ~8GB VRAM

Hướng dẫn Test API

Gemma 4 Multimodal (thử nghiệm)

NEW Thử nghiệm CVD=2 (chung backend)

Gemma 4 Multimodal — Cùng model Gemma 4 E2B nhưng expose qua endpoint riêng /gemma4-mm/ để thử nghiệm. Hỗ trợ image+text+audio input. Sử dụng OpenAI-compatible API với base64 image. Dùng chung vLLM backend (port 8092) với gemma4 text service. Qwen3 tạm dừng. GPU 1 hiện chạy medGemma 1.5 Multimodal y khoa.

pnt.badt.vn/gemma4-mm/ Image (PNG/JPG base64) Video frames Audio OpenAI-compatible

Test API API Docs

DeepSeek OCR

CVD=0 - RTX 3060 #1

OCR hybrid Qwen2.5-VL-3B-Instruct 4-bit + EasyOCR fallback — hỗ trợ image & PDF

pnt.badt.vn/deepseek_ocr/ VRAM: 1.3GB/12GB Model: Qwen2.5-VL-3B-Instruct + EasyOCR

API Docs Chi tiết

CDSS Reasoning Engine

Bayesian AI

Hệ thống Hỗ trợ Chẩn đoán Lâm sàng - LLM + Clinical Reasoning Maps + GNN/Bayesian Inference trên GPU. Phân tích triệu chứng, tính xác suất chẩn đoán động.

pnt.badt.vn/reasoning/ GPU Bayesian + GNN OCR + Transcribe + Map

API Docs Chi tiết

Non-GPU Services

Medical Patient Simulator

Mô phỏng bệnh nhân ảo với RAG và LLM cho giáo dục y khoa

dv.badt.vn/ai/virtualpatient/ Educational

API Docs Chi tiết

Text-to-Speech

TTS

Chuyển văn bản thành giọng nói tự nhiên - Hỗ trợ 28+ ngôn ngữ

pnt.badt.vn/text2speech/ 28+ languages

API Docs TTS Studio Chi tiết

CodeFinder

Semantic Search

Tìm kiếm ngữ nghĩa mã y tế (ICD10, ICPC2, CPT) với vector + BM25 hybrid search và cache 3 lớp

pnt.badt.vn/codefinder/ ChromaDB + BM25

API Docs Chi tiết

Dịch Vụ Chuyên Biệt

OpenClaw AI Agent

NEW DeepSeek R1

Agent AI tự chủ chạy DeepSeek R1 — quản lý task, lập lịch, thực thi pipeline phân tích phức tạp. Kết nối từ máy chủ 192.168.1.248.

192.168.1.248:18789 DeepSeek R1 Task Management

OpenClaw Chat Dashboard Chi tiết

MediTutor

Education

Hệ thống đào tạo y khoa tương tác — LLM-powered tutor, quiz, case-based learning cho sinh viên và bác sĩ

pnt.badt.vn/meditutor/ Port: 8028

API Docs Frontend

Vietnam Medical AI

Hệ Thống AI Y Khoa Tiên Tiến

Các Dịch Vụ API

AI Agent — Trợ Lý Tổng Hợp

AI Agent — Unified Assistant

GPU Services

Medical Transcribe

Face Recognition

Gemma 4 E4B Local LLM + Multimodal

GPU Agent

Qwen 2.5-7B LLM

medGemma 1.5 Multimodal (Y khoa)

Gemma 4 Multimodal (thử nghiệm)

DeepSeek OCR

CDSS Reasoning Engine

Non-GPU Services

Medical Patient Simulator

Text-to-Speech

CodeFinder

Dịch Vụ Chuyên Biệt

OpenClaw AI Agent

MediTutor

Hướng Dẫn Nhanh

Bắt Đầu

Xác Thực

Ví Dụ Code

Xử Lý Lỗi

Trạng Thái Hệ Thống

Real-time Service Status