ห้องปฏิบัติการวิจัย DataGlass • เอกสารการทำงาน • พฤษภาคม 2026

จากความรู้สึกไปสู่การอนุมานภายหลัง: บทความวิจัยเกี่ยวกับDecision Engine ของ DataGlass สำหรับการจัดสรรงบประมาณโฆษณาอีคอมเมิร์ซ

การสื่อสารสาธารณะที่เข้มงวดของDecision Engine ของ DataGlass สำหรับการจัดสรรงบประมาณโฆษณารายวันบนตลาดที่ควบคุมด้วยแพลตฟอร์ม - พื้นฐานก่อนอัลกอริทึม เหตุผลในการวิเคราะห์ที่ล้มเหลว (ช่องว่าง ROAS ที่รายงานเทียบกับจริง และอคติเฉลี่ยต่อเนื่อง) วิธีวิทยาแบบเบย์ + bandits-with-knapsacks และการเพิ่มผลกำไรพอร์ตโฟลิโอเชิงประจักษ์ 18–24% พร้อมการจัดสรรที่ลดลง ความถี่

Bhum Soonjun · DataGlass Research2,481 words

เผยแพร่: 4 พฤษภาคม 2026
เวลาอ่าน: 12 นาที
ระดับความยาก: ขั้นสูง

เอกสารการทำงาน พฤษภาคม 2026 บันทึกทางเทคนิคร่วมสำหรับต้นฉบับที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิ [1] และชุดข้อเสนอแบบจำลองภายใน [2]–[5]

บทคัดย่อ

บทความนี้นำเสนอDecision Engine ของ DataGlass สำหรับการจัดสรรงบประมาณการโฆษณารายวันบนตลาดที่ควบคุมแพลตฟอร์ม เช่น Shopee, Lazada, TikTok Shop และผลิตภัณฑ์ที่ได้รับการสนับสนุนจาก Amazon ในระดับรายละเอียดที่เหมาะสมสำหรับการสื่อสารการวิจัยต่อหน้าสาธารณะ ขั้นแรกเราจะบันทึก ยุคก่อนอัลกอริธึม ของพฤติกรรมผู้ขาย ซึ่งแนวทางปฏิบัติที่โดดเด่นคือการปรับราคาเสนอแบบลองผิดลองถูก การอนุมานค่าเฉลี่ยแบบกลิ้งของเมตริกแดชบอร์ด และการจัดสรรใหม่ตามความรู้สึกที่ขับเคลื่อนโดยตัวเลขผลตอบแทนจากค่าโฆษณา (ROAS) ที่รายงาน แทนที่จะเป็นผลตอบแทนที่ปรับตามส่วนต่างกำไรที่แท้จริง เราแสดงให้เห็นในเชิงวิเคราะห์ว่าภายใต้สมมติฐานด้านกำไรขั้นต้น ผลตอบแทน และค่าธรรมเนียมแพลตฟอร์มที่สมจริง การวิเคราะห์พฤติกรรมเฉลี่ยแบบกลิ้งของ ROAS ที่รายงานจะจัดสรรการใช้จ่ายอย่างเป็นระบบ จัดสรรแคมเปญที่มีส่วนสนับสนุนต่ำมากเกินไป และกระตุ้นให้เกิดการเสนอราคาปั่นป่วนมากเกินไปซึ่งมีปฏิสัมพันธ์กับระบบการเรียนรู้ของแพลตฟอร์มในทางตรงข้าม จากนั้นเราจะสรุปรากฐานด้านระเบียบวิธีของระบบ DataGlass — โมเดลการตอบสนองแบบเบย์ เครื่องมือเพิ่มประสิทธิภาพพอร์ตโฟลิโอที่มีข้อจำกัด ซึ่งแก้ไขเงื่อนไขกำไรส่วนเพิ่มที่เท่ากัน และเลเยอร์ที่ไม่คงที่ซึ่งรวม Thompson Sampling การตรวจจับจุดเปลี่ยนตาม CUSUM และการตรวจจับระบอบการปกครองสามชั้น — และรายงานผลลัพธ์เชิงประจักษ์จากการทดสอบย้อนกลับแบบออฟไลน์และการปรับใช้ A/B แบบสด ซึ่งแสดงการปรับปรุงผลกำไรพอร์ตโฟลิโอ 18–24% พร้อมความถี่ในการจัดสรรที่ลดลง รายละเอียดการสอบเทียบที่เป็นกรรมสิทธิ์ถูกละเว้นโดยเจตนา บทความนี้มีจุดมุ่งหมายเพื่อเป็นการสื่อสารสาธารณะที่เข้มงวดเกี่ยวกับรากฐานการวิจัยของระบบมากกว่าคำแนะนำในการทำซ้ำ

1. บทนำ

ปัจจุบันการค้าปลีกออนไลน์กลายเป็นอุตสาหกรรมที่มีมูลค่า 6.3 ล้านล้านเหรียญสหรัฐ ซึ่งดูดซับเงินค้าปลีกประมาณหนึ่งในหกที่ใช้ไปทั่วโลก [6], [22] ภายในนั้น การกระจายความสามารถในการวิเคราะห์เป็นแบบสองรูปแบบอย่างรวดเร็ว: ผู้ค้าปลีกระดับแพลตฟอร์มกลุ่มเล็กๆ ดำเนินการชุดข้อมูลการตัดสินใจแบบ end-to-end ในขณะที่ผู้ขายในตลาดกลางและขนาดเล็กส่วนใหญ่ขึ้นอยู่กับสเปรดชีต วิดเจ็ตแดชบอร์ด และสัญชาตญาณ [7] ช่องว่างในการตัดสินใจและสติปัญญา — ความแตกต่างระหว่างพฤติกรรมผู้ขายที่ดีที่สุดและสังเกตได้เกี่ยวกับมาตรการเชิงพาณิชย์ เช่น ราคา การส่งเสริมการขาย และการใช้จ่ายโฆษณา — ได้รับการบันทึกไว้ในเชิงปริมาณในงานสำรวจ และเป็นที่เข้าใจกันอย่างกว้างขวางว่าเป็นส่วนแบ่งที่มีความหมายของการมีส่วนร่วมที่สูญเสียไปโดยผู้ขาย SMB ในแต่ละปี [7], [10], [17]

ภายในช่องว่างนี้ การจัดสรรงบประมาณการโฆษณาเป็นปัญหาเฉียบพลันโดยเฉพาะอย่างยิ่งด้วยเหตุผลเชิงโครงสร้างสามประการ ประการแรก บนแพลตฟอร์มตลาดสมัยใหม่ ผู้ขายไม่ได้เสนอราคา: แพลตฟอร์มเป็นผู้เสนอราคา ผู้ขายควบคุมเฉพาะงบประมาณรายวันและ ROAS เป้าหมาย และอัลกอริธึมการเสนอราคาอัตโนมัติของแพลตฟอร์มจะตัดสินใจคำหลัก ผู้ชม ตำแหน่ง และอัตรา [1], [4] ประการที่สอง แพลตฟอร์มไม่ชัดเจน: ไม่มีการเปิดเผยกลไกการประมูล อัลกอริธึมการจับคู่ และคะแนนความเกี่ยวข้อง ดังนั้นผู้ขายจึงสังเกตเฉพาะการแมปอินพุตและเอาท์พุตเท่านั้น ซึ่งโครงสร้างภายในจะต้องอนุมานจากข้อมูล [21], [25] ประการที่สาม แพลตฟอร์มจะลงโทษการแทรกแซงความถี่สูงอย่างแข็งขัน ผ่านการหยุดช่วงการเรียนรู้ หน้าต่างการเปลี่ยนแปลงขั้นต่ำ และการควบคุมความเร็ว ดังนั้นการตอบสนองที่ชัดเจน — เสนอราคาให้หนักขึ้น และปรับแต่งใหม่ให้บ่อยขึ้น — ในทางปฏิบัติ ต่อต้าน [1], [3], [5]

บทความนี้จัดทำเอกสารว่า DataGlass ซึ่งเป็น Decision Engine ระดับ production ที่ ณ ไตรมาสที่ 1 ปี 2569 บริหารจัดการงบประมาณสำหรับผู้ขายที่ใช้งานอยู่หลายร้อยรายในตลาดเอเชียตะวันออกเฉียงใต้ที่สำคัญ จัดการกับโครงสร้างข้อจำกัดนี้ได้อย่างไร การมีส่วนร่วมของบทความนั้น แตกต่างจากงานระเบียบวิธีพื้นฐานที่มีสองเท่า:

1. เรากำหนดลักษณะของ พื้นฐานก่อนอัลกอริธึม — กลุ่มของการศึกษาสำนึกแบบแมนนวลที่ผู้ขายรายย่อยใช้ในปัจจุบัน — โดยมีความแม่นยำเชิงปริมาณเพียงพอที่จะทำให้โหมดความล้มเหลวชัดเจน โดยเฉพาะอย่างยิ่ง เราจัดช่องว่างระหว่าง ROAS ที่รายงานกับ ROAS ที่ปรับส่วนต่างตามจริงและแสดงให้เห็นว่าการคาดการณ์ค่าเฉลี่ยแบบกลิ้งภายใต้ช่องว่างนี้เป็นตัวประมาณค่าที่มีอคติเชิงเส้นกำกับของกำไรส่วนเพิ่มต่อดอลลาร์

2. เราสรุปหลักระเบียบวิธีของ DataGlass ในระดับที่จำเป็นในการประเมินตำแหน่งทางวิทยาศาสตร์ ในขณะที่ระงับการสอบเทียบที่เป็นกรรมสิทธิ์ ซึ่งทำให้ระบบการผลิตแตกต่างจากการนำตำราเรียนไปใช้

ส่วนที่เหลือของบทความมีการจัดระเบียบดังนี้ ส่วนที่ 2 สำรวจแนวทางปฏิบัติในอดีตและปัจจุบันของการจัดการงบประมาณโฆษณาด้วยตนเอง ส่วนที่ 3 มาจากเหตุผลเชิงวิเคราะห์ที่ทำให้การปฏิบัติล้มเหลว ส่วนที่ 4 แก้ไขสัญกรณ์และระบุปัญหาการปรับให้เหมาะสมอย่างเป็นทางการ ส่วนที่ 5 ทบทวนวรรณกรรมทางวิชาการที่เกี่ยวข้อง ส่วนที่ 6 อธิบายระบบ DataGlass ในระดับสูง ส่วนที่ 7 กล่าวถึงตำแหน่งและลักษณะทั่วไป ส่วนที่ 8 และ 9 ครอบคลุมถึงข้อจำกัดและข้อสรุป การอ้างอิงเป็นไปตามรูปแบบตัวเลขของ IEEE

2. ยุคก่อนอัลกอริทึม: วิธีที่ผู้ขายเสนอราคาโดยไม่มีการเพิ่มประสิทธิภาพ

ในยุคตลาดหลังปี 2015 ส่วนใหญ่ การตัดสินใจเรื่องงบประมาณโฆษณาฝั่งผู้ขายนั้นดำเนินการโดยมนุษย์ที่ทำงานบนสเปรดชีต แดชบอร์ด และสัญชาตญาณ ฮิวริสติกสามตระกูลมีอิทธิพลเหนือ

2.1 การจัดสรรใหม่แบบลองผิดลองถูก

รูปแบบที่พบบ่อยที่สุดในการสำรวจผู้ขายที่สังเคราะห์โดย Jungle Scout [10], Shopify Commerce Trends [17] และดัชนี McKinsey SMB [13] คือการกวาดล้างด้วยตนเองรายสัปดาห์หรือสองครั้งต่อสัปดาห์: ผู้ขายเปิดแดชบอร์ดตลาด จัดเรียงแคมเปญตาม ROAS ที่รายงาน เพิ่มงบประมาณในแคมเปญควอไทล์สูงสุดด้วยเปอร์เซ็นต์คงที่ (โดยทั่วไป 10–30%) ลดหรือหยุดควอไทล์ด้านล่างชั่วคราว และ จะกลับมาอีกครั้งในสัปดาห์หน้า ไม่มีแบบจำลองของความสัมพันธ์ระหว่างการตอบสนองต่องบประมาณ ไม่มีการวัดปริมาณของความไม่แน่นอน และไม่มีการแยกสัญญาณออกจากสัญญาณรบกวน สมมติฐานโดยนัยคือ ROAS ที่รายงานของเมื่อวานเป็นตัวทำนายที่ดีของ ROAS ส่วนเพิ่มของวันพรุ่งนี้ ซึ่งเป็นสมมติฐานที่เราแสดงในส่วนที่ 3 ล้มเหลวอย่างเป็นระบบและไม่สมมาตร

ผลการดำเนินงานได้รับการบันทึกไว้อย่างดี การแก้ไขงบประมาณบ่อยครั้งจะทำให้เกิดการรีเซ็ตขั้นตอนการเรียนรู้ฝั่งแพลตฟอร์ม ในระหว่างที่โปรแกรมเสนอราคาอัตโนมัติรวบรวมข้อมูลการสำรวจใหม่ๆ และราคาต่อหนึ่งคลิกที่มีประสิทธิผลของแคมเปญจะเพิ่มขึ้น [1, §3] ผู้ขายสังเกตเห็นประสิทธิภาพที่ลดลง ตอบสนองต่อการแก้ไขเพิ่มเติม และสร้างวงจรการปั่นเสริมด้วยตนเองขึ้น การประมาณการเชิงประจักษ์จากการตรวจสอบภายใน DataGlass ของบัญชีผู้ขายที่ไม่มีการจัดการ แนะนำว่า 30–55% ของการแก้ไขงบประมาณด้วยตนเองทั้งหมดที่ทำในระหว่างช่วงการเรียนรู้นั้นเป็นค่าลบสุทธิในการสนับสนุนที่คาดหวัง

2.2 การคาดการณ์ค่าเฉลี่ยแบบโรลลิ่ง

ผู้ขายที่มีตัวเลขมากกว่าจะใช้ค่าเฉลี่ยแบบต่อเนื่อง (โดยทั่วไปคือ 7 วันหรือ 14 วัน) ของ ROAS ของแดชบอร์ดหรือรายได้ต่อแคมเปญ และใช้เป็นค่าประมาณสำหรับประสิทธิภาพในวันถัดไป ปล่อย $R_{t}$ แสดงถึง ROAS ที่รายงานในวันนั้น $t$ และ $\overset{ˉ}{R}_{t}^{(k)}$ ท้าย- $k$ หมายถึง,

\overset{ˉ}{R}_{t}^{(k)} = \frac{1}{k} τ = t - k + 1 \sum t R_{τ}, R_{t + 1} = \overset{ˉ}{R}_{t}^{(k)},

ผู้ขายจึงกำหนดงบประมาณของวันพรุ่งนี้ตามสัดส่วน:

b_{i, t + 1} = b_{i, t} \cdot \frac{R ˉ _{i, t}^{(k)}}{R ˉ _{∙, t}^{(k)}},

ที่ไหน $\overset{ˉ}{R}_{∙, t}^{(k)}$ คือค่าเฉลี่ยทั้งพอร์ตโฟลิโอ นี่คือ เครื่องมือเพิ่มประสิทธิภาพพอร์ตโฟลิโอของคนจน: โดยจะจัดสรรใหม่ให้กับแคมเปญที่มีผลตอบแทนที่รายงานล่าสุดสูงกว่าค่าเฉลี่ย มันมีระเบียบวินัยมากกว่าสัญชาตญาณบริสุทธิ์ แต่ก็มีพยาธิวิทยาทุกอย่างของตัวประมาณค่าค่าเฉลี่ยเคลื่อนที่บนสัญญาณที่ไม่นิ่ง เซ็นเซอร์ และแสดงที่มาล่าช้า และดังที่เราแสดงด้านล่าง มันมีอคติไปในทิศทางที่ให้รางวัลอย่างเป็นระบบกับแคมเปญที่มีส่วนร่วมน้อย

2.3 ความรู้สึกและสัญชาตญาณ

แนวทางปฏิบัติประการที่สาม ซึ่งมักจะอยู่ร่วมกับสองประการแรกคือสัญชาตญาณ: ผู้ขาย "รู้" ว่าแคมเปญกำลังไปได้ดีเนื่องจากมีคำสั่งซื้อที่วุ่นวายเมื่อเร็ว ๆ นี้ หรือ "รู้สึก" ว่าคู่แข่งกำลังก้าวร้าวใน SKU ใดรายการหนึ่งโดยเฉพาะ มีวรรณกรรมเศรษฐศาสตร์พฤติกรรมที่สำคัญที่บันทึกไว้ว่ามนุษย์มีปฏิกิริยาเกินเหตุอย่างเป็นระบบต่อการเสริมแรงล่าสุด อัตราฐานน้ำหนักต่ำกว่า และสร้างความสับสนกับความแปรปรวนด้วยสัญญาณ โปรดดูการสำรวจโดย Kahneman [12] และงานโฆษณาเชิงทดลองของ Lewis และ Rao [14] ซึ่งแสดงให้เห็นว่าอัตราส่วนสัญญาณต่อเสียงรบกวนในการวัดโฆษณาเชิงสังเกตการณ์นั้นไม่เอื้ออำนวยอย่างยิ่ง จนโดยทั่วไปแล้วจะไม่สนับสนุนการกล่าวอ้างเชิงสาเหตุที่ทำให้เกิดความมั่นใจจากผู้ขาย SMB ด้วยข้อมูลของตนเอง

2.4 ต้นทุนรวมของพื้นฐานก่อนอัลกอริทึม

ผลกระทบทางเศรษฐกิจโดยตรง ผู้ขาย SMB ใช้เวลาโดยประมาณในสหรัฐฯ$80–110 billion on marketplace ads in 2024 [22]. Conservatively, if 15–25% of that spend is misallocated by the heuristics in sections 2.1–2.3, the deadweight loss is on the order of US$12–28 พันล้านต่อปี นี่คือพื้นผิวที่สามารถโต้แย้งได้ซึ่งระบบการตัดสินใจและสติปัญญากล่าวถึง

3. เหตุใดการวิเคราะห์พฤติกรรมด้วยตนเองจึงล้มเหลว: ช่องว่าง True-ROAS และอคติแบบ Rolling-Mean

ตอนนี้เราได้จัดรูปแบบความล้มเหลวหลักสองโหมดของพื้นฐานก่อนอัลกอริทึมอย่างเป็นทางการ

3.1 ช่องว่าง ROAS ที่รายงานเทียบกับจริง

รูปแดชบอร์ดที่แสดงให้ผู้ขายเห็นคือ

R_{i}^{rep} = \frac{Attributed Revenue _{i}}{Spend _{i}} .

นี่ไม่ใช่*การวัดผลกำไร ส่วนต่างส่วนต่างที่แท้จริงของผู้ขายจากค่าโฆษณาส่วนเพิ่มจะต้องสุทธิจากต้นทุนสินค้าที่ขาย ค่าคอมมิชชันของแพลตฟอร์ม การประมวลผลการชำระเงิน เงินอุดหนุนสำหรับการปฏิบัติตาม และการสูญเสียคืนสินค้าหลังการขาย ปล่อย $m_{g}$ แสดงถึงอัตรากำไรขั้นต้นในตะกร้า $f$ สัดส่วนค่าธรรมเนียมแพลตฟอร์มแบบรวมทั้งหมด $r$ อัตราผลตอบแทนหลังการขาย และ $ρ$ เศษส่วนของค่าใช้จ่ายในการปฏิบัติตามและการชำระเงิน ROAS ที่ปรับด้วยกำไรสุทธิ มีค่าประมาณ

R_{i}^{true} = R_{i}^{rep} \cdot m_{g} \cdot (1 - r) \cdot (1 - f - ρ) .

สำหรับผู้ขายเครื่องแต่งกายทั่วไปในเอเชียตะวันออกเฉียงใต้ด้วย $m_{g} \approx 0.45$ , $r \approx 0.18$ , $f + \rho \approx 0.17$ROAS ที่รายงาน เท่ากับ 5.0× สอดคล้องกับ ROAS จริง ที่ประมาณ

R^{true} \approx 5.0 \cdot 0.45 \cdot 0.82 \cdot 0.83 \approx 1.53,

นั่นคือ ตัวคูณการมีส่วนร่วม 1.53× จากค่าใช้จ่ายในการโฆษณา แทนที่จะเป็นพาดหัว 5× แคมเปญที่รายงาน ROAS 2.5 เท่า ซึ่งผู้ขายส่วนใหญ่จะถือว่ามีสุขภาพที่ดี มีตัวคูณการมีส่วนร่วมจริงประมาณ 0.77 เท่า กล่าวคือ เป็นการขาดทุนในทุก ๆ ดอลลาร์ส่วนเพิ่ม ปรากฏการณ์นี้ไม่ได้บอบบาง มันเป็นโครงสร้าง และไม่สามารถมองเห็นได้บนแดชบอร์ดตลาดมาตรฐานใดๆ ดูการรักษาได้ยาวนานขึ้นใน the true-ROAS reconstruction note สำหรับตัวอย่างผลงานเฉพาะของ Shopee และ contribution margin สำหรับคำจำกัดความตามรูปแบบบัญญัติ

Apparel (high-margin) Electronics (low-margin)

รูปที่ 1 — ROAS ที่รายงานเทียบกับ ROAS จริง (ปรับกำไรแล้ว) ในโปรไฟล์สองหมวดหมู่ เส้นสีส้มคือเครื่องแต่งกายที่มีอัตรากำไรสูงและให้ผลตอบแทนต่ำ (

m_{g} = 0.45

r = 0.18

f + ρ = 0.17

); เส้นประคืออุปกรณ์อิเล็กทรอนิกส์สำหรับผู้บริโภคที่มีอัตรากำไรต่ำและให้ผลตอบแทนปานกลาง (

m_{g} = 0.15

r = 0.10

f + ρ = 0.17

). เครื่องแต่งกายคุ้มทุนที่รายงาน อยู่ที่ 3.3×; อุปกรณ์อิเล็กทรอนิกส์ไม่จนกว่าจะรายงาน data 9× — จุดคุ้มทุนคือ ROAS จริง = 1 × ตัวเลข 5× ที่รายงานนั้นดูเหมือนกันบนแดชบอร์ดสำหรับทั้งสองหมวดหมู่ แต่เครื่องแต่งกายมีส่วนสนับสนุน ~1.5× ในขณะที่อุปกรณ์อิเล็กทรอนิกส์ทำงานที่ ~0.6× — นั่นคือ การขาดทุนในทุก ๆ ดอลลาร์ส่วนเพิ่ม

เลขคณิตเดียวกันมีลักษณะทั่วไปในหมวดหมู่ต่างๆ สำหรับอุปกรณ์อิเล็กทรอนิกส์สำหรับผู้บริโภคที่ไหน $m_{g}$ มักจะอยู่ที่ 0.10–0.20 ROAS คุ้มทุน ที่รายงาน อยู่ในช่วง 6–10× สำหรับ SKU ความงามที่มีอัตรากำไรสูงซึ่งมีอัตราผลตอบแทนต่ำ จะอยู่ใกล้กับ 2× ดังนั้น ROAS ที่รายงานถึงจุดคุ้มทุนจึงแตกต่างกันไปตามลำดับความสำคัญในหมวดหมู่ต่างๆ แต่ผู้ขายมักใช้จุดตัดแดชบอร์ดเดียว (โดยทั่วไปคือ 3× หรือ 4×) ในพอร์ตการลงทุนที่ต่างกัน

3.2 เหตุใดการอนุมานค่าเฉลี่ยแบบกลิ้งจึงมีอคติ

พิจารณาแคมเปญที่ความสัมพันธ์ระหว่างงบประมาณและรายได้ที่แท้จริงเว้ากับผลตอบแทนที่ลดลง - เชิงประจักษ์คือเส้นโค้งแบบเนินเขาที่อิ่มตัว [9], [16]:

λ_{i} (b) = λ_{i}^{m a x} \cdot \frac{b ^{θ_{i}}}{K _{i}^{θ_{i}} + b ^{θ_{i}}},

ดังนั้นฟังก์ชันรายได้ที่สอดคล้องกัน $ρ_{i} (b) = AOV_{i} \cdot λ_{i} (b) \cdot q_{i}$ ก็เว้าเหมือนกัน โดยที่ $q_{i}$ คืออัตราการแปลงและ $AOV_{i}$ คือมูลค่าการสั่งซื้อเฉลี่ย ROAS ส่วนเพิ่มตามงบประมาณ $b$ เป็น

\frac{\partial ρ _{i}}{\partial b} (b) = AOV_{i} \cdot q_{i} \cdot \frac{θ _{i} \cdot K _{i}^{θ_{i}} \cdot b ^{θ_{i} - 1}}{( K _{i}^{θ_{i}} + b ^{θ_{i}} ) ^{2}} .

นี่คือปริมาณที่การจัดสรรแบบเพิ่มผลกำไรสูงสุดต้องทำให้เท่ากันในแคมเปญต่างๆ ในทางตรงกันข้าม ROAS เฉลี่ย ที่รายงานคือ

R_{i}^{rep} (b) = \frac{ρ _{i} ( b )}{b} = AOV_{i} \cdot q_{i} \cdot \frac{λ _{i}^{m a x} \cdot b ^{θ_{i} - 1}}{K _{i}^{θ_{i}} + b ^{θ_{i}}},

ซึ่งเป็นผลตอบแทน เฉลี่ย ต่อดอลลาร์ ไม่ใช่ผลตอบแทนส่วนเพิ่ม ตามอาร์กิวเมนต์ความเว้ามาตรฐาน ค่าเฉลี่ยจะเกินขอบเขตเมื่อใดก็ตามที่เส้นโค้งเว้า และช่องว่าง

Δ_{i} (b) = R_{i}^{rep} (b) - \frac{\partial ρ _{i}}{\partial b} (b)

คือการใช้จ่ายแบบโมโนโทนที่เพิ่มขึ้นเหนือระบอบการปกครองที่อิ่มตัว ตัวประมาณค่าเฉลี่ยต่อเนื่องที่กำหนดเป้าหมายโดยเฉลี่ยมากกว่า ROAS ส่วนเพิ่ม จึงจัดสรรมากเกินไปให้กับแคมเปญที่อิ่มตัวแล้ว เนื่องจาก ROAS เฉลี่ย ยังคงสูงแม้ว่า ROAS ส่วนเพิ่ม เข้าใกล้ศูนย์ก็ตาม นี่เป็นกลไกการวิเคราะห์ที่อยู่เบื้องหลังการสังเกตเชิงประจักษ์ว่าแคมเปญที่ใช้จ่ายสูงภายใต้การจัดการด้วยตนเองแสดงการมีส่วนร่วมที่ลดลงแม้จะมีตัวชี้วัดแดชบอร์ดที่เสถียร [1, §X] เอกสารที่นำมาใช้ — การปรับเส้นโค้ง ROAS ส่วนเพิ่มข้ามแพลตฟอร์มให้เท่ากัน แทนที่จะจัดสรรตามส่วนแบ่งรายได้ในอดีต — ได้รับการบันทึกไว้ใน the cross-platform ad-budget allocation note.

Average ROAS (dashboard) Marginal ROAS (true)

รูปที่ 2 — อคติค่าเฉลี่ยการกลิ้งบนเส้นโค้งเนินที่อิ่มตัว เมื่องบประมาณเพิ่มขึ้น ROAS เฉลี่ย (สิ่งที่แดชบอร์ดแสดง) จะลดลงอย่างช้าๆ ในขณะที่ ROAS ส่วนเพิ่ม ซึ่งเป็นปริมาณที่ผู้จัดสรรที่เพิ่มผลกำไรสูงสุดต้องทำให้เท่ากันในแคมเปญต่างๆ จะยุบลงจนเหลือศูนย์ การกวาดล้างแบบแมนนวลที่อ่านแคมเปญรางวัลบนแดชบอร์ดที่ทำงานในพื้นที่สีเทา ซึ่งดอลลาร์โฆษณาหยุดจ่ายเพื่อตัวมันเอง — พารามิเตอร์ฮิลล์:

λ^{m a x} = 60, K = 18, θ = 1.4, AOV \cdot q =

290 บาท ช่องว่างระหว่างเส้นโค้งทั้งสองคืออคติค่าเฉลี่ยแบบกลิ้ง

3.3 เวลาในการตอบสนองของการระบุแหล่งที่มาและปัญหาเสียงรบกวน

ประเด็นที่สองทำให้เกิดอคติ โดยทั่วไปแพลตฟอร์ม Marketplace จะเครดิตการซื้อให้กับโฆษณาภายในกรอบเวลาการระบุแหล่งที่มา 7–14 วัน [21] ROAS ที่รายงานในวันนั้น $t$ จึงผสมกลุ่มประชากรตามรุ่นการคลิกจากวันต่างๆ $t - 13$ ผ่าน $t$ ด้วยน้ำหนักที่ไม่สำคัญและการเปิดเผยบางส่วนของกลุ่มตามรุ่นในแต่ละวัน ค่าเฉลี่ยแบบต่อเนื่อง 7 วันของ ROAS รายวันที่มีการระบุแหล่งที่มาบางส่วนคือการบิดตัวของเคอร์เนลที่ปรับให้เรียบสองอันและรับช่วงความล่าช้าของเฟสประมาณ 4–7 วัน สัมพันธ์กับ ROAS ส่วนเพิ่มรายวันที่แท้จริง ผู้ขายที่ตอบสนองต่อสัญญาณที่ล่าช้านี้ไล่ล่าระบอบการปกครองก่อนหน้านี้ได้อย่างมีประสิทธิภาพ และความสัมพันธ์อัตโนมัติที่เกิดจากการผสมผสานการระบุแหล่งที่มามักเข้าใจผิดว่าเป็นสัญญาณของแท้ — ปัญหาการถดถอยแบบหลอกๆ ในตำราเรียนในแง่ของ Granger และ Newbold

Lewis และ Rao [14] สร้างผลลัพธ์ เศรษฐศาสตร์ที่ไม่พึงประสงค์ของการวัดผลการโฆษณา: สำหรับปริมาณการโฆษณา SMB โดยทั่วไป ข้อผิดพลาดมาตรฐานของการประมาณค่า ROAS แบบสังเกตมีขนาดใหญ่พอที่จะประมาณจุดภายใน $\pm 30%$ แยกไม่ออกจากค่าว่างในทางสถิติ ผู้ขายที่ไม่มีการระบุปริมาณความไม่แน่นอนจึงทำการตัดสินใจเกี่ยวกับสัญญาณที่อยู่ต่ำกว่าระดับเสียงรบกวนของตนเองอย่างเป็นทางการ

3.4 การลดสัดส่วนสินค้าคงคลังและการเสื่อมสภาพของ CVR

เอฟเฟกต์ประสมประการที่สาม บันทึกโดย Ma และคณะ [15] สำหรับโฆษณาบนการค้นหาของ Taobao คืออัตรา Conversion ลดลงเมื่อปริมาณการคลิกเกินขนาดสินค้าคงคลังหรือความสามารถในการเติมเต็มของผู้ขาย ปล่อย $u_{i, t}$ แสดงถึงการใช้แคมเปญ

q_{i} (u) = q_{i}^{base} \cdot g (u),

ที่ไหน $g$ เป็นฟังก์ชันการลดสัดส่วนแบบโมโนโทนที่สูงกว่าเกณฑ์เฉพาะแคมเปญ การวิเคราะห์พฤติกรรมแบบ Rolling-mean ซึ่งถือว่า $q_{i}$ มีค่าคงที่ $b$ จะระบุผลตอบแทนส่วนเพิ่มของแคมเปญที่เพิ่มงบประมาณเกินเกณฑ์อย่างเป็นระบบ ปัญหาการดำเนินงานที่เชื่อมต่อ — เมื่อปริมาณโฆษณาปรับขนาดเป็น stockout หน้าต่าง — ได้รับการปฏิบัติในเชิงปริมาณใน the stockout-cost note.

3.5 ต้นทุนคอมโพสิต

โดยรวมแล้ว การวิเคราะห์พฤติกรรมแบบแมนนวลเป็นตัวประมาณค่าส่วนเพิ่มที่มีอคติ เนื่องจาก (i) สร้างความสับสนให้กับรายงานด้วย True ROAS (ii) สร้างความสับสนให้กับค่าเฉลี่ยด้วยส่วนเพิ่ม (iii) ละเว้นเวลาในการตอบสนองของแหล่งที่มา (iv) เพิกเฉยต่อการลดสัดส่วนสินค้าคงคลัง และ (v) เพิกเฉยต่อต้นทุนด้านแพลตฟอร์มของการปั่นราคาเสนอ ระบบ DataGlass จัดการกับแต่ละสิ่งเหล่านี้อย่างชัดเจน สรุปการปรับโครงสร้าง — การเปลี่ยนจากโมเดลแดชบอร์ดไปเป็นโมเดลการตัดสินใจ the decision-engine architecture note.

4. การกำหนดปัญหา

เรานำสัญลักษณ์ของรายงานทางเทคนิคที่เกี่ยวข้องมาใช้ [1], [5] อนุญาต $i \in {1, \dots, N}$ จัดทำดัชนีแคมเปญที่ใช้งานอยู่ของผู้ขายและปล่อยให้ $b_{i, t} \in [\underline{b}_{i}, \overline{b}_{i}]$ แสดงถึงงบประมาณรายวันในแต่ละวัน $t$ . ปัญหาการตัดสินใจในแต่ละเช้าคือการเลือกเวกเตอร์ $b_{t} = (b_{1, t}, \dots, b_{N, t})$ ที่เพิ่มผลกำไรพอร์ตโฟลิโอที่คาดหวังสูงสุดภายใต้ข้อจำกัดในการดำเนินงาน

กำไรที่คาดหวังของแคมเปญ $i$ ตามงบประมาณ $b$ ยอมรับการสลายตัว

π_{i} (b) = AOV_{i} \cdot λ_{i} (b) \cdot q_{i} (u_{i, t}) \cdot m_{g} - s_{i} (b) - c_{i}^{plat} (b),

ที่ไหน $λ_{i} (b)$ คือคลิกที่คาดหวัง (จำลองเป็นกระบวนการนับลบ-ทวินามเพื่อดูดซับการกระจายตัวมากเกินไป [8], [23]) $q_{i} (\cdot)$ คืออัตราการแปลง (จำลองเป็นเบต้า–ทวินามที่มีการเจือจางตามการใช้งาน [15]) $s_{i} (b)$ คือการใช้จ่ายที่รับรู้ (ใกล้เคียงแต่ไม่เท่ากันกับงบประมาณภายใต้การกำหนดความเร็วของแพลตฟอร์ม) $c_{i}^{plat} (b)$ คือค่าคอมมิชชันแพลตฟอร์มและค่าธรรมเนียม และ $m_{g}$ คือตัวคูณอัตรากำไรขั้นต้นที่แนะนำในส่วนที่ 3.1

ปัญหาพอร์ตโฟลิโอก็คือ

b_{t} max i = 1 \sum N π_{i} (b_{i, t}) s.t. i \sum b_{i, t} \leq B_{t}, b_{i, t} \in F_{i, t},

ที่ไหน $B_{t}$ คือมูลค่าสูงสุดของพอร์ตโฟลิโอรายวันและ $F_{i, t}$ เข้ารหัสความเป็นไปได้ต่อแคมเปญ — ขั้นต่ำของงบประมาณ การหยุดช่วงการเรียนรู้ หน้าต่างความเสถียร ขีดจำกัดการนับการดำเนินการ และรั้ว ROAS องค์ประกอบที่แน่นอนของ $F_{i, t}$ เป็นส่วนหนึ่งของข้อกำหนดที่เป็นกรรมสิทธิ์และได้รับการบันทึกไว้ภายใน [3]–[5]

ภายใต้การปรับสภาพภายในให้เหมาะสมที่สุด เงื่อนไขลำดับแรกจะให้คุณลักษณะ กำไรส่วนเพิ่มเท่ากัน:

\frac{\partial π _{i}}{\partial b _{i}} (b_{i}^{*}) = μ^{*} \forall i \in A_{t},

ที่ไหน $μ^{*}$ คือราคาเงาบนข้อจำกัดด้านงบประมาณและ $A_{t}$ คือชุดของแคมเปญที่ไม่ได้อยู่ในข้อจำกัดความเป็นไปได้ที่มีผลผูกพัน ราคาเงา $μ^{*}$ มีการตีความทางเศรษฐกิจที่สะอาดในฐานะส่วนเพิ่มของพอร์ตโฟลิโอดอลลาร์ถัดไป การทำให้ผู้ขายมองเห็นวัตถุนี้ถือเป็นการปรับปรุงที่ไม่สำคัญเหนือพื้นฐานการศึกษาสำนึก

5. รากฐานระเบียบวิธี

วิธีการที่เป็นรากฐานของ DataGlass นำมาจากวรรณกรรมสี่เนื้อหา

การสร้างแบบจำลองเส้นโค้งการตอบสนอง ฟังก์ชันความอิ่มตัวของ Hill มีต้นกำเนิดมาจากเภสัชวิทยา [16] และกลายเป็นมาตรฐานในการสร้างแบบจำลองส่วนประสมการตลาดสมัยใหม่ผ่านกรอบงาน Robyn ของ Google [11] และระบบ Meridian ของ Meta แบบฟอร์ม Michaelis–Menten เป็นกรณีพิเศษ ( $θ = 1$ ); กฎกำลังคือขีดจำกัดงบประมาณเล็กๆ น้อยๆ Naik และ Raman [18] ขยายสิ่งเหล่านี้ไปสู่การทำงานร่วมกันด้านมัลติมีเดีย การนับคลิกที่กระจายมากเกินไปได้รับการจัดการผ่านการกำหนดพารามิเตอร์เชิงลบทวินาม (NB2) [8], [23] โดยมีการทดสอบการกระจายเกินตามเจตนารมณ์ของคณบดี [9] อัตราการแปลงได้รับการจำลองเป็นเบต้า–ทวินามโดยมีการเจือจางตามการใช้งาน [15] ริชาร์ดสัน และคณะ [21] จัดเตรียมงานทำนายอัตราการคลิกผ่านพื้นฐานสำหรับระบบการเริ่มเย็น

การเพิ่มประสิทธิภาพที่มีข้อจำกัดและการโจรกรรมด้วยเป้สะพายหลัง ภายใต้ข้อจำกัดด้านงบประมาณ ปัญหาจะอยู่ภายในกรอบการทำงาน Bandits-with-Knapsacks (BwK) [20] ซึ่งความเสียใจจะขยายขนาดตามอัตราส่วนที่เหมาะสมต่องบประมาณ เฮย์มันน์ และคณะ [25] ศึกษากลุ่มmulti-armed banditsแบบผสมผสานเพื่อการจัดสรรพอร์ตโฟลิโอ ความเสียใจแบบไดนามิกภายใต้ความไม่คงที่เป็นไปตาม Besbes และคณะ [26] มีขอบเขต

R_{T} = O ((K V_{T})^{1/3} T^{2/3}),

ที่ไหน $V_{T}$ คือความแปรผันของเส้นทาง เฉินและคณะ [27] เพิ่มความคมชัดให้กับสิ่งนี้ $\tilde{O} (V_{T}^{res} T)$ เมื่อปรับสภาพข้อมูลด้านข้าง บัลเซโร และคณะ [28], [29] พัฒนา dual mirror descent สำหรับการจัดสรรออนไลน์พร้อมทั้งเสียใจและรับประกันการละเมิดข้อจำกัด ซึ่งเกี่ยวข้องโดยตรงกับข้อจำกัด ROI ต่อแคมเปญในการตั้งค่าของเรา

การสำรวจภายใต้ความไม่แน่นอน Thompson Sampling ประสบความเสียใจ $O (N T lo g T)$ ในmulti-armed bandits [30] และเหนือกว่าเชิงประจักษ์ภายใต้ข้อเสนอแนะที่ล่าช้าและการระบุโมเดลที่ไม่ถูกต้อง [31], [32] โอหยาง และคณะ [33] ขยาย Thompson Sampling ไปสู่ MDP ที่ไม่รู้จัก Jauvion และคณะ [34] ปรับใช้สำหรับการเสนอราคาส่วนหัวในแพลตฟอร์มฝั่งอุปทานโดยแสดงให้เห็นผลกำไรระดับการผลิตเหนือ UCB

การตรวจจับจุดเปลี่ยน CUSUM เป็นขั้นตอนการตรวจจับออนไลน์แบบคลาสสิก [19] ที่มีคุณสมบัติความยาวเฉลี่ย (ARL) ที่เข้าใจกันดี [24] การเรียกซ้ำคือ

S_{t} = max (0, S_{t - 1} + e_{t} - \frac{h}{2 σ}), alarm at S_{t} > h,

ที่ไหน $e_{t}$ เป็นปริมาณคงเหลือที่ได้มาตรฐานและ $h$ ได้รับการปรับเทียบกับ ARL เป้าหมายผ่านการประมาณของ Siegmund [24] ทางเลือกสมัยใหม่ ได้แก่ การตรวจจับจุดเปลี่ยนออนไลน์แบบเบย์ [35] และวิธีการที่ใช้เคอร์เนลที่สำรวจใน Aminikhanghahi และ Cook [36]

การระบุสาเหตุ Gordon และคณะ [37] สร้างมาตรฐานทองคำของการทดลองแบบสุ่มสำหรับการวัดผลการโฆษณา ลูอิสและราว [14] บันทึกเศรษฐศาสตร์สัญญาณต่อเสียงรบกวนที่ไม่เอื้ออำนวยของการวัดเชิงสังเกตการณ์ Oster [38] ให้การวิเคราะห์ความไวสำหรับอาการสับสนที่ไม่มีใครสังเกตเห็น โบรเดอร์เซ่น และคณะ [39] พัฒนาอนุกรมเวลาเชิงโครงสร้างแบบเบย์สำหรับผลกระทบเชิงสาเหตุ DataGlass ผสมผสานการก่อกวนแบบสุ่มในอนาคต และการวิเคราะห์ความไวแบบ Oster [1, §VIII]

6. ระบบ DataGlass

เราอธิบายระบบในระดับสูงสุดที่สอดคล้องกับความเข้มงวดที่จำเป็นสำหรับการสื่อสารทางวิชาการ พารามิเตอร์การปรับแต่งที่เป็นกรรมสิทธิ์ องค์ประกอบข้อจำกัดที่แม่นยำ การออกแบบการทดลองก่อกวน และค่าเริ่มต้นเฉพาะเซ็กเมนต์จะไม่ถูกเปิดเผยที่นี่ มีการบันทึกไว้ใน [2]–[5] และในข้อกำหนดทางวิศวกรรมการผลิต

6.1 องค์ประกอบที่ 1 — โมเดลการตอบสนองแบบเบย์

สำหรับแต่ละแคมเปญ $i$ , DataGlass จะรักษาการกระจายแบบหลังไว้ $(λ_{i}^{m a x}, K_{i}, θ_{i}, q_{i}, k_{i})$ , ที่ไหน $k_{i}$ คือพารามิเตอร์การกระจายตัวของ NB2 โมเดลการคลิกใช้ความน่าจะเป็นเชิงลบ-ทวินามกับความอิ่มตัวของฮิลล์ โมเดลการแปลงใช้ความน่าจะเป็นแบบเบต้า-ทวินามพร้อมการเจือจางตามการใช้งาน การประมาณค่าเป็นสองขั้นตอนพร้อมการรักษาเสถียรภาพของสันในระยะการคลิกและการอัปเดตแบบรวมในขั้นตอนการแปลง ข้อผิดพลาดมาตรฐานถูกแพร่กระจายโดยใช้การแก้ไข Murphy-Topel [40] ซึ่งมีรูปแบบการแยกตัวประกอบที่แน่นอนในการตั้งค่าของเรา เนื่องจากเงื่อนไขสองขั้นตอนคือสถิติที่แยกจากกันอย่างเพียงพอ [1, §VI]

ตัวเลือกการออกแบบที่สำคัญคือ การอัพเกรด Hill แบบมีเงื่อนไข: เส้นโค้งอิ่มตัวจะถูกติดตั้งเฉพาะเมื่อช่วงงบประมาณล่าสุดของแคมเปญเป็นไปตามที่พอใจ $b_{m a x} / b_{m i n} > 2$ และขนาดตัวอย่างที่มีประสิทธิผลเกินเกณฑ์ความสามารถในการระบุตัวตน [1, §VI.B]; มิฉะนั้น จะใช้รูปแบบพาราเมตริกแบบอนุรักษ์นิยมมากกว่า สิ่งนี้กล่าวถึงข้อกังวลด้านโครงสร้างและเชิงปฏิบัติโดยตรงที่เกิดขึ้นใน Raue และคณะ [41] และหลีกเลี่ยงความพอดีที่เป็นระบบซึ่งเกิดขึ้นเมื่อพารามิเตอร์ความอิ่มตัวแบบไม่เชิงเส้นถูกประเมินจากข้อมูลที่แปรผันไม่เพียงพอ

6.2 องค์ประกอบ 2 — เครื่องมือเพิ่มประสิทธิภาพพอร์ตโฟลิโอที่มีข้อจำกัด

เมื่อพิจารณาจากด้านหลัง เครื่องมือเพิ่มประสิทธิภาพจะแก้ปัญหาโปรแกรมของส่วนที่ 4 โครงสร้างชุดที่ใช้งานอยู่ถูกใช้ประโยชน์โดยการลดปัญหาให้เป็นการค้นหาราคาเงาในมิติเดียว $μ$ :

μ^{*} = μ such that i \in A (μ) \sum b_{i}^{*} (μ) = B_{t},

แก้ไขโดยการแบ่งส่วน ความแตกต่างโดยนัยของ $b_{i}^{*} (μ^{*})$ ด้วยความเคารพต่อพารามิเตอร์ด้านหลังจะแพร่กระจายความไม่แน่นอนไปสู่งบประมาณที่แนะนำ ดังนั้นทุกๆ ผลลัพธ์จะมาพร้อมกับช่วงเวลาที่น่าเชื่อถือมากกว่าการประมาณจุด องค์ประกอบข้อจำกัดแบบเต็ม จำนวนการดำเนินการสูงสุด และกฎไทเบรกระหว่างข้อจำกัดที่มีผลผูกพันพร้อมกันไม่ได้ถูกบันทึกไว้ที่นี่ อะนาล็อกที่ใช้ — แปลมุมมองราคาเงาเป็นการดำเนินการที่ผู้ขายต้องเผชิญ — มีภาพประกอบอยู่ใน the ads-optimisation solution surface.

6.3 องค์ประกอบที่ 3 — ชั้นที่ไม่อยู่กับที่

กลไกทั้งสามทำงานร่วมกัน Thompson Sampling ให้การสำรวจตามหลักการโดยคำนึงถึง [30] เป็นพิเศษสำหรับการตั้งค่าที่มีงบประมาณจำกัดตาม Balseiro และคณะ [29]. การตรวจจับจุดเปลี่ยนแปลงตาม CUSUM สำหรับส่วนที่เหลือต่อแคมเปญจะเริ่มทำงานเมื่อเส้นโค้งการตอบสนองเปลี่ยนไป โดยมีการปรับเทียบเกณฑ์กับ ARL เป้าหมายผ่าน [24] และตารางการปรับเทียบภายใน [1, §VII.B] เครื่องมือตรวจจับระบอบการปกครองสามชั้น — Hotelling หลายตัวแปรที่รับรู้ปฏิทิน $T^{2}$ และบันทึกเหตุการณ์ภายนอก — การโหวตในโหมดการทำงานระดับวัน (เชิงรุก ระมัดระวัง เชิงสำรวจ ระงับ)

6.4 องค์ประกอบที่ 4 — การระบุสาเหตุ

เพื่อป้องกันไม่ให้ระบบเรียนรู้ความสัมพันธ์ในการตอบสนองต่องบประมาณที่สับสน DataGlass จะใช้ความแตกต่างแรกสำหรับผู้รบกวนที่เคลื่อนไหวช้า และดำเนินการทดลองการก่อกวนแบบสุ่มในอนาคต — การเปลี่ยนแปลงงบประมาณแบบสุ่มที่มีขนาดเล็ก ปรับเทียบแล้ว และจงใจ — ซึ่งสร้างการเปลี่ยนแปลงการระบุที่ชัดเจนในบริเวณใกล้เคียงของจุดปฏิบัติการปัจจุบัน ต่อไปนี้เป็นกลไกมาตรฐานทองคำสำหรับการประมาณสาเหตุ ขนาดการก่อกวน กำหนดเวลา และขั้นตอนการพับหลักฐานผลลัพธ์กลับเข้าไปด้านหลังเป็นส่วนหนึ่งของการสอบเทียบที่เป็นความลับของระบบ

7. การอภิปราย

สามแต้มสมควรได้รับการเน้นย้ำ

ประการแรก ข้อได้เปรียบเชิงประจักษ์ของ DataGlass เหนือพื้นฐานแบบแมนนวลคือ ไม่ใช่ โดยหลักแล้วเป็นฟังก์ชันของการแสดงออกของโมเดล ฟังก์ชัน Hill, Negative Binomial และ Beta-Binomial เป็นส่วนประกอบในตำราเรียน ข้อได้เปรียบมาจาก (i) การสร้างแบบจำลองวัตถุประสงค์ ที่ถูกต้อง — การสนับสนุนที่ปรับด้วยกำไรสุทธิมากกว่า ROAS ที่รายงาน — และ (ii) การเคารพโครงสร้างข้อจำกัดที่เกิดจากแพลตฟอร์ม โดยเฉพาะอย่างยิ่งต้นทุนของการปั่นป่วนการประมูลภายใต้กลไกขั้นตอนการเรียนรู้ ระบบ deep-RL ที่ไร้เดียงสาซึ่งเพิกเฉยต่อข้อจำกัดเหล่านี้อาจทำให้เกิดพฤติกรรมการผลิตที่แย่กว่าผู้ปฏิบัติงานแบบแมนนวลที่มีระเบียบวินัยสูง แม้ว่าจะมีฟังก์ชันการประมาณค่าที่สมบูรณ์กว่าก็ตาม ซึ่งสอดคล้องกับการค้นพบการระเหยของ Liu และคณะ [42] สำหรับการเสนอราคาแบบเรียลไทม์

ประการที่สอง มูลค่าของระบบสำหรับผู้ขายจะเป็นสีเดียวในช่องว่างระหว่าง ROAS ที่รายงานกับ ROAS จริง ผู้ขายในหมวดหมู่ที่มีอัตรากำไรต่ำและมีอัตราผลตอบแทนสูงจะได้รับประโยชน์อย่างไม่เป็นสัดส่วน เนื่องจาก ROAS ที่รายงานคุ้มทุนนั้นสูงกว่าสิ่งที่แดชบอร์ดแนะนำมาก และพื้นฐานที่กำหนดราคาพอร์ตโฟลิโอด้วยตนเองนั้นผิดพลาดอย่างรุนแรงที่สุด ผู้ขายในหมวดหมู่ที่มีอัตรากำไรสูงและผลตอบแทนต่ำจะเห็นว่าการเพิ่มขึ้นน้อยลง แม้ว่าจะยังมีสาระสำคัญอยู่ก็ตาม

ประการที่สาม วิธีการที่อธิบายไว้ในที่นี้ครอบคลุมมากกว่าแพลตฟอร์มเฉพาะที่ระบบถูกใช้งานตั้งแต่แรก อินเทอร์เฟซ — งบประมาณรายวันบวก ROAS เป้าหมาย พร้อมการเสนอราคาอัตโนมัติแบบทึบด้านแพลตฟอร์ม — ปัจจุบันเป็นรูปแบบที่โดดเด่นในตลาดหลักๆ (Shopee, Lazada, TikTok Shop, Amazon Sponsored Products, Walmart Connect, Mercado Libre Ads) ระบบที่ถือว่าอินเทอร์เฟซนี้เป็นออบเจ็กต์การสร้างแบบจำลองชั้นหนึ่ง แทนที่จะสร้างความไม่สะดวกให้กับกลุ่มเทคโนโลยีโฆษณาทั่วไป มีข้อได้เปรียบเชิงโครงสร้างที่ไม่ใช่เรื่องบังเอิญ อนุกรมวิธานเต็มรูปแบบของการตัดสินใจของผู้ขายในชั้นการตัดสินใจแบบรวมซึ่งรวมถึงการกำหนดราคา สินค้าคงคลัง การส่งเสริมการขาย และการปรับเปลี่ยนเฉพาะบุคคล ได้รับการบันทึกไว้ใน the decision-intelligence playbook.

8. ข้อจำกัดและการทำงานในอนาคต

ข้อจำกัดหลายประการได้รับการยอมรับอย่างชัดเจนใน [1, §XI] และ [5, §11]

ฟังก์ชั่น Hill สามารถระบุได้ก็ต่อเมื่อช่วงงบประมาณกว้างเพียงพอและขนาดตัวอย่างที่มีประสิทธิภาพเกินเกณฑ์ที่ปรับเทียบแล้ว หากต่ำกว่าเกณฑ์นี้ ระบบจะกลับไปใช้รูปแบบพาราเมตริกที่อนุรักษ์นิยมมากขึ้น โดยมีการลดลงที่สอดคล้องกันในการเพิ่มที่คาดหวัง การถ่วงน้ำหนักการระบุแหล่งที่มาแบบกว้าง (ปัจจุบัน $α_{broad} = 0.5$ ) เป็นการศึกษาพฤติกรรมและเป็นตัวเลือกสำหรับการแทนที่ด้วยโมเดล attribution-window-aware การสับสนระหว่าง Target-ROAS ได้รับการแก้ไขบางส่วนผ่านการรวมตัวแปรร่วม การรักษาเต็มรูปแบบจำเป็นต้องมีการเพิ่มประสิทธิภาพงบประมาณ และ ROAS เป้าหมายร่วมกัน ซึ่งวางแผนไว้สำหรับเวอร์ชัน 2.0 การรวมรายวันเป็นข้อจำกัด v1.0 การจัดสรรระหว่างวันอยู่ระหว่างการพัฒนา ตรวจพบการกินเนื้อคนในแคมเปญ แต่ยังไม่ได้ปรับเปลี่ยนในเครื่องมือเพิ่มประสิทธิภาพ โดยมีส่วนขยาย v1.1 ทำให้เกิดการลงโทษร่วมอย่างเป็นทางการ $π_{i + j} (b_{i}, b_{j}) = π_{i} (b_{i}) + π_{j} (b_{j}) - κ min (b_{i}, b_{j})$ ที่ไหน $κ$ ประมาณจากความสัมพันธ์บางส่วนเชิงลบ [43] มีการวางแผนการจัดสรรระดับกลุ่มโฆษณาสำหรับเวอร์ชัน 2.0

ประสิทธิภาพเชิงประจักษ์ที่เลวร้ายที่สุดของระบบเกิดขึ้นภายใต้การเปลี่ยนแปลงระบอบการปกครองที่เกิดขึ้นทั่วโลกพร้อมกัน (ส่งผลกระทบต่อหลายแคมเปญ) และไม่มีการแจ้งเตือน (ไม่มีปฏิทินหรือสัญญาณบันทึกเหตุการณ์) เครื่องตรวจจับระบอบการปกครองสามชั้นช่วยลดแต่ไม่ได้ขจัดความเสี่ยงนี้ ตัวตรวจจับหลายตัวแปรเชิงรุกมากขึ้นอยู่ในการวิจัย

สำหรับข้อกำหนดมาตรฐานของกรอบตัวอย่างที่อยู่ภายใต้การอ้างสิทธิ์ "ในข้อมูลของเรา" ทุกรายการในคลังข้อมูลการวิจัยของ DataGlass — ขนาดตัวอย่าง กรอบเวลา การยกเว้น กรอบเวลาการระบุแหล่งที่มา — โปรดดู DataGlass research methodology.

9. บทสรุป

Decision Engine ของ DataGlass เข้ามาแทนที่กลุ่มหลักที่โดดเด่นของการศึกษาพฤติกรรมการใช้งบประมาณโฆษณาแบบแมนนวล ได้แก่ การจัดสรรแบบลองผิดลองถูก การประมาณค่าแบบเฉลี่ยต่อเนื่อง และการแก้ไขการเสนอราคาที่ขับเคลื่อนด้วยสัญชาตญาณ ด้วยไปป์ไลน์การตัดสินใจแบบ Bayesian ที่สอดคล้องกันซึ่งเคารพข้อจำกัดของแพลตฟอร์มที่ผู้ขายในตลาดดำเนินการอยู่จริง เราได้แสดงให้เห็นในเชิงวิเคราะห์ว่าเส้นฐานแบบกำหนดเองนั้นมีอคติในลักษณะโครงสร้างที่สามารถระบุตัวตนได้ โดยสร้างความสับสนให้กับรายงานด้วย True ROAS ค่าเฉลี่ยกับผลตอบแทนส่วนเพิ่ม เนื่องมาจากสัญญาณที่ไม่ล่าช้า และไม่มีข้อจำกัดกับการดำเนินการที่เป็นไปได้ที่มีข้อจำกัด เราได้สรุปรากฐานด้านระเบียบวิธีของระบบทดแทนและรายงานการตรวจสอบเชิงประจักษ์ซึ่งแสดงการปรับปรุงผลกำไรพอร์ตโฟลิโอ 18–24% พร้อมความถี่ในการจัดสรรที่ลดลง การสอบเทียบที่เป็นกรรมสิทธิ์ซึ่งทำให้ระบบการผลิตแตกต่างจากการนำตำราเรียนไปใช้นั้นจงใจระงับไว้ เนื้อหาทางวิชาการได้รับการบันทึกไว้ในต้นฉบับที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิ [1]

สำหรับผู้ขาย ความหมายนั้นเกิดขึ้นโดยตรง: ระบบที่กำหนดเป้าหมายวัตถุประสงค์ที่ถูกต้องบนชุดข้อจำกัดที่ถูกต้องจะรวบรวมส่วนสนับสนุนที่ไม่มีในเชิงโครงสร้างสำหรับการดำเนินการด้วยตนเอง สำหรับสาขานี้ ความหมายก็คือ หน่วยข่าวกรองในการตัดสินใจ ที่รับรู้ถึงอินเทอร์เฟซ ซึ่งคำนึงถึงพื้นผิว API ของแพลตฟอร์มอย่างจริงจังในฐานะวัตถุการสร้างแบบจำลอง กลายเป็นขอบเขตการวิจัยที่มีผลผูกพันในการโฆษณาในตลาด

รับทราบ

ผู้เขียนขอขอบคุณทีมวิจัย DataGlass สำหรับชุดข้อเสนอ [2]–[5] คณะกรรมการตรวจสอบโดยผู้ทรงคุณวุฒิ [44], [45] สำหรับคำติชมที่สำคัญซึ่งกำหนดรูปแบบการแก้ไขครั้งที่ 1 ถึง 3 และผู้ขาย Shopee ที่เข้าร่วมที่ยินยอมให้ใช้งาน A/B แบบสด

อ้างอิง

รายงานทางเทคนิคภายใน

[1] DataGlass Research, "DataGlass: Bayesian Budget Allocation for E-Commerce Advertising Under Platform Constraints," IEEE Trans. Artif. Intell., manuscript ready for submission, March 2026.

[2] DataGlass Research, "DataGlass Ads Optimizer: Model Proposal," internal technical report, March 2026.

[3] DataGlass Research, "DataGlass Model Proposal — Revision 1," internal technical report, March 2026.

[4] DataGlass Research, "DataGlass Model Proposal — Revision 2," internal technical report, March 2026.

[5] DataGlass Research, "DataGlass Model Proposal — Revision 3 (Final)," internal technical report, March 2026.

บริบทอุตสาหกรรมและเศรษฐกิจมหภาค

[6] eMarketer / Insider Intelligence, "Worldwide retail and e-commerce sales forecast 2024–2027," 2024.

[7] J. Madsoon, "Mind the Gap: Quantifying Seller Pain in E-Commerce," DataGlass Research working paper, May 2026.

[10] Jungle Scout, "State of the Amazon Seller 2024," industry survey ( $n = 2, 164$ ), 2024.

[13] McKinsey & Co., "State of Small and Medium Business Index," 2024.

[17] Shopify, "Commerce Trends 2024," industry report ( $n > 1, 000$ merchants), 2024.

[22] eMarketer, "Global retail e-commerce sales 2024," industry data, 2024.

เส้นโค้งการตอบสนองและการสร้างแบบจำลองอุปสงค์

[8] A. C. Cameron and P. K. Trivedi, Regression Analysis of Count Data, 2nd ed. Cambridge Univ. Press, 2013.

[9] C. B. Dean, "Testing for overdispersion in Poisson and binomial regression models," J. Amer. Statist. Assoc., vol. 87, no. 418, pp. 451–457, 1992.

[11] Y. Jin, Y. Wang, Y. Sun, D. Chan, and J. Koehler, "Bayesian methods for media mix modeling with carryover and shape effects," Google Research, 2017.

[15] X. Ma, L. Zhao, G. Huang, Z. Wang, Z. Hu, X. Zhu, and K. Gai, "Entire space multi-task model: An effective approach for estimating post-click conversion rate," in Proc. SIGIR, 2018.

[16] C. Ritz, F. Baty, J. C. Streibig, and D. Gerhard, "Dose-response analysis using R," PLoS ONE, vol. 10, no. 12, e0146021, 2015.

[18] P. A. Naik and K. Raman, "Understanding the impact of synergy in multimedia communications," J. Marketing Res., vol. 40, no. 4, pp. 375–388, 2003.

[21] M. Richardson, E. Dominowska, and R. Ragno, "Predicting clicks: Estimating the click-through rate for new ads," in Proc. WWW, 2007.

[23] J. M. Ver Hoef and P. L. Boveng, "Quasi-Poisson vs. negative binomial regression," Ecology, vol. 88, no. 11, pp. 2766–2772, 2007.

โจร การเพิ่มประสิทธิภาพ และการเรียนรู้ออนไลน์

[20] A. Badanidiyuru, R. Kleinberg, and A. Slivkins, "Bandits with knapsacks," J. ACM, vol. 65, no. 3, pp. 1–55, 2018.

[25] B. Heymann et al., "Combinatorial bandits for budget allocation in marketplace advertising," arXiv preprint, 2025.

[26] O. Besbes, Y. Gur, and A. Zeevi, "Stochastic multi-armed-bandit problem with non-stationary rewards," in Proc. NeurIPS, 2014.

[27] Y. Chen, C. Lee, and H. Luo, "A new framework for oracle-efficient online learning with side information," in Proc. COLT, pp. 1060–1081, 2019.

[28] S. R. Balseiro, H. Lu, and V. Mirrokni, "Dual mirror descent for online allocation problems," in Proc. ICML, 2023.

[29] S. R. Balseiro, H. Lu, and V. Mirrokni, "Primal-dual budget pacing with ROI constraints," in Proc. ICML, 2024.

[30] S. Agrawal and N. Goyal, "Thompson Sampling for contextual bandits with linear payoffs," in Proc. ICML, 2013.

[31] O. Chapelle and L. Li, "An empirical evaluation of Thompson Sampling," in Proc. NeurIPS, 2011.

[32] D. J. Russo, B. Van Roy, A. Kazerouni, I. Osband, and Z. Wen, "A tutorial on Thompson Sampling," Found. Trends Mach. Learn., vol. 11, no. 1, pp. 1–96, 2018.

[33] Y. Ouyang, M. Gagrani, A. Naber, and R. Jain, "Learning unknown Markov decision processes: A Thompson Sampling approach," in Proc. NeurIPS, 2017.

[34] G. Jauvion, N. Grislain, P. Sielenou, A. Veyrat, and D. Gourru, "Optimization of an SSP's header bidding strategy using Thompson Sampling," in Proc. KDD, 2018.

การเสนอราคาแบบเรียลไทม์และการเรียนรู้การเสริมกำลัง

[42] S. Liu, C. Hua, Y. Chen, and J. Wang, "Real-time bidding strategy in display advertising: An empirical analysis," arXiv:2208.07516, 2022.

การตรวจจับจุดเปลี่ยนและการไม่นิ่ง

[19] E. S. Page, "Continuous inspection schemes," Biometrika, vol. 41, nos. 1–2, pp. 100–115, 1954.

[24] D. Siegmund, Sequential Analysis: Tests and Confidence Intervals. Springer, 1985.

[35] R. P. Adams and D. J. C. MacKay, "Bayesian online changepoint detection," arXiv:0710.3742, 2007.

[36] S. Aminikhanghahi and D. J. Cook, "A survey of methods for time series change point detection," Knowledge and Information Systems, vol. 51, no. 2, pp. 339–367, 2017.

การระบุสาเหตุและการวัดผลการโฆษณา

[14] R. A. Lewis and J. M. Rao, "The unfavorable economics of measuring the returns to advertising," Quart. J. Econ., vol. 130, no. 4, pp. 1941–1973, 2015.

[37] B. R. Gordon, F. Zettelmeyer, N. Bhargava, and D. Chapsky, "A comparison of approaches to advertising measurement," Marketing Sci., vol. 38, no. 2, pp. 193–225, 2019.

[38] E. Oster, "Unobservable selection and coefficient stability," J. Bus. Econ. Stat., vol. 37, no. 2, pp. 187–204, 2019.

[39] K. H. Brodersen, F. Gallusser, J. Koehler, N. Remy, and S. L. Scott, "Inferring causal impact using Bayesian structural time-series models," Ann. Appl. Stat., vol. 9, no. 1, pp. 247–274, 2015.

[40] K. M. Murphy and R. H. Topel, "Estimation and inference in two-step econometric models," J. Bus. Econ. Stat., vol. 3, no. 4, pp. 370–373, 1985.

การระบุตัวตนและรากฐานทางสถิติ

[41] A. Raue et al., "Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood," Bioinformatics, vol. 25, no. 15, pp. 1923–1929, 2009.

เอฟเฟกต์ข้ามช่องสัญญาณ

[43] I. M. Dinner, H. J. Van Heerde, and S. A. Neslin, "Driving online and offline sales: The cross-channel effects of traditional, online display, and paid search advertising," J. Marketing Res., vol. 51, no. 5, pp. 527–545, 2014.

รากฐานด้านพฤติกรรม

[12] D. Kahneman, Thinking, Fast and Slow. Farrar, Straus and Giroux, 2011.

เอกสารการตรวจสอบภายใน

[44] DataGlass Research, "DataGlass Model Proposal — Peer Review (R1)," internal review, March 2026.

[45] DataGlass Research, "DataGlass Model Proposal — Peer Review (R2 and R3)," internal review, March 2026.

DataGlass เป็นแพลตฟอร์มข้อมูลการตัดสินใจที่เน้นการวิจัยสำหรับผู้ขายอีคอมเมิร์ซ สำหรับการสอบถามเกี่ยวกับความร่วมมือ การบูรณาการ หรือความร่วมมือด้านการวิจัย โปรดติดต่อผู้เขียนโดยตรง บัญชีที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิของวิธีการดังกล่าวกำลังจะเปิดตัวเร็วๆ นี้ [1].

อ่านต่อ

จากบทความเชิงทฤษฎีสู่ระบบจริง

ลิงก์ภายในที่เชื่อมบทความวิจัยนี้กลับเข้าสู่บทความ ภาพรวมการทำงาน และหน้าโซลูชันที่เกี่ยวข้อง

บทความที่เกี่ยวข้อง

คำศัพท์ที่เกี่ยวข้อง

นำไปใช้กับ DataGlass

DataGlass DataGlass ทำงานอย่างไรดู workflow ตั้งแต่ data ingestion ไปจนถึง recommendation ที่ deploy ได้ DataGlass Ads optimizationเชื่อม contribution margin, attribution และ budget allocation กับ campaign control DataGlass Profit marginประกอบกำไรสมทบต่อ SKU จาก order line ข้ามค่าธรรมเนียมและส่วนลด DataGlass รายงานวิจัยฉบับเต็มการสำรวจเทคนิคของ retailers ระดับ platform ทั้งด้าน pricing, forecasting, inventory, promotions, personalization DataGlass Cross-domain meta-reviewรากฐานทางทฤษฎีของระบบนี้ — meta-review เชื่อม finance, operations, insurance, causal inference เข้ากับ e-commerce decision intelligence