Real Estate ML Microservice
ดาต้า ผลงานเด่น

Real Estate ML Microservice

Microservice แบบ machine learning ที่ทำนายมูลค่าทรัพย์สินและผลตอบแทนค่าเช่า โดยใช้ข้อมูลเชิงพื้นที่ ข้อมูลการซื้อขายย้อนหลัง และตัวชี้วัดทางเศรษฐกิจมหภาค

ภาพรวม

ไมโครเซอร์วิส Python ระดับโปรดักชันที่ให้บริการทำนายราคาประเมินอสังหาริมทรัพย์ผ่าน REST API โดยผสมผสานข้อมูลธุรกรรมย้อนหลัง ข้อมูลเศรษฐกิจมหภาคแบบอนุกรมเวลา และฟีเจอร์เชิงภูมิศาสตร์ เพื่อให้การอนุมานใช้เวลาต่ำกว่า 50 มิลลิวินาที พร้อมความสามารถในการอธิบายผลด้วย SHAP

จุดเด่น

  • โมเดล ensemble แบบ gradient-boosted ที่รวม XGBoost และ LightGBM ฝึกด้วยข้อมูลธุรกรรม ตัวชี้วัดเศรษฐกิจมหภาค และฟีเจอร์ภูมิศาสตร์จาก OpenStreetMap
  • การออกแบบฟีเจอร์เชิงลึกครอบคลุมคุณสมบัติของอสังหาริมทรัพย์ ตัวชี้วัดย่านที่อยู่อาศัย และปัจจัยมหภาค (อัตราดอกเบี้ย CPI ดัชนีขายต่อ)
  • ไปป์ไลน์การฝึกโมเดลรายคืนออร์เคสเตรตด้วย Prefect พร้อมเลื่อนขั้นโมเดลอัตโนมัติหากผ่านเกณฑ์ validation
  • จัดการเวอร์ชันและติดตาม artefact ของโมเดลด้วย MLflow เพื่อความสามารถในการทำซ้ำและย้อนกลับ
  • REST API บน FastAPI คืนค่าประเมินราคา ช่วงความเชื่อมั่น และฟีเจอร์สำคัญที่มีอิทธิพลต่อผลทำนายผ่าน SHAP
  • เอนด์พอยต์ batch scoring สำหรับวิเคราะห์พอร์ตโฟลิโออสังหาฯ จำนวนมาก ควบคู่กับการอนุมานแบบเรียลไทม์

สถาปัตยกรรม

ส่วนประกอบ รายละเอียด
Inference API บริการ FastAPI เปิด REST API สำหรับคำขอทำนายแบบเรียลไทม์รายรายการและแบบ batch
Model Ensemble โมเดล ensemble XGBoost + LightGBM โหลดในโปรเซสเพื่อการทำนายความหน่วงต่ำ
Feature Pipeline เลเยอร์สร้างฟีเจอร์ด้วย Python รวมคุณสมบัติอสังหาฯ ตัวชี้วัดย่าน และตัวชี้วัดมหภาค
Data Sources ธุรกรรมย้อนหลัง อนุกรมเวลามหภาค และฟีเจอร์ภูมิศาสตร์จาก OpenStreetMap และชุดข้อมูลการใช้ที่ดินของรัฐ
Training Orchestration Prefect flows ดึงข้อมูลจากคลังข้อมูลรายคืน ฝึกโมเดลใหม่ และเลื่อนขั้นหากผ่านเกณฑ์ validation
Model Registry MLflow บันทึกการทดลอง จัดการเวอร์ชัน artefact และควบคุมการเปลี่ยนสถานะสู่โปรดักชัน
Explainability คำนวณค่า SHAP เพื่อแสดงฟีเจอร์ที่มีอิทธิพลสูงสุดต่อแต่ละการทำนายพร้อมผลประเมินราคา

ตัวชี้วัดสำคัญ

ความหน่วงการทำนาย

เฉลี่ยต่ำกว่า 50 มิลลิวินาที

ค่ามัธยฐาน APE

ต่ำกว่า 6% บนข้อมูลนอกตัวอย่าง

รอบการฝึกใหม่

รายคืน

โหมดการอนุมาน

เรียลไทม์ + batch

การอธิบายผล

ฟีเจอร์สำคัญผ่าน SHAP

เทคโนโลยี

PythonXGBoostscikit-learnFastAPIMLflowPostgreSQLDocker

รายละเอียด

หมวดหมู่ ดาต้า
จำนวนเทคโนโลยี 7
สถานะ เผยแพร่แล้ว
ผลงานเด่น ใช่

แกลเลอรี

screenshot_1.png
screenshot_2.png
screenshot_3.png

ผลงานที่เกี่ยวข้อง