เอกสารการทำงาน พฤษภาคม 2026 บันทึกทางเทคนิคร่วมสำหรับต้นฉบับที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิ [1] และชุดข้อเสนอแบบจำลองภายใน [2]–[5]
บทคัดย่อ
บทความนี้นำเสนอระบบการตัดสินใจอัจฉริยะของ DataGlass สำหรับการจัดสรรงบประมาณการโฆษณารายวันบนตลาดที่ควบคุมแพลตฟอร์ม เช่น Shopee, Lazada, TikTok Shop และผลิตภัณฑ์ที่ได้รับการสนับสนุนจาก Amazon ในระดับรายละเอียดที่เหมาะสมสำหรับการสื่อสารการวิจัยต่อหน้าสาธารณะ ขั้นแรกเราจะบันทึก ยุคก่อนอัลกอริธึม ของพฤติกรรมผู้ขาย ซึ่งแนวทางปฏิบัติที่โดดเด่นคือการปรับราคาเสนอแบบลองผิดลองถูก การอนุมานค่าเฉลี่ยแบบกลิ้งของเมตริกแดชบอร์ด และการจัดสรรใหม่ตามความรู้สึกที่ขับเคลื่อนโดยตัวเลขผลตอบแทนจากค่าโฆษณา (ROAS) ที่รายงาน แทนที่จะเป็นผลตอบแทนที่ปรับตามส่วนต่างกำไรที่แท้จริง เราแสดงให้เห็นในเชิงวิเคราะห์ว่าภายใต้สมมติฐานด้านกำไรขั้นต้น ผลตอบแทน และค่าธรรมเนียมแพลตฟอร์มที่สมจริง การวิเคราะห์พฤติกรรมเฉลี่ยแบบกลิ้งของ ROAS ที่รายงานจะจัดสรรการใช้จ่ายอย่างเป็นระบบ จัดสรรแคมเปญที่มีส่วนสนับสนุนต่ำมากเกินไป และกระตุ้นให้เกิดการเสนอราคาปั่นป่วนมากเกินไปซึ่งมีปฏิสัมพันธ์กับระบบการเรียนรู้ของแพลตฟอร์มในทางตรงข้าม จากนั้นเราจะสรุปรากฐานด้านระเบียบวิธีของระบบ DataGlass — โมเดลการตอบสนองแบบเบย์ เครื่องมือเพิ่มประสิทธิภาพพอร์ตโฟลิโอที่มีข้อจำกัด ซึ่งแก้ไขเงื่อนไขกำไรส่วนเพิ่มที่เท่ากัน และเลเยอร์ที่ไม่คงที่ซึ่งรวม Thompson Sampling การตรวจจับจุดเปลี่ยนตาม CUSUM และการตรวจจับระบอบการปกครองสามชั้น — และรายงานผลลัพธ์เชิงประจักษ์จากการทดสอบย้อนกลับแบบออฟไลน์และการปรับใช้ A/B แบบสด ซึ่งแสดงการปรับปรุงผลกำไรพอร์ตโฟลิโอ 18–24% พร้อมความถี่ในการจัดสรรที่ลดลง รายละเอียดการสอบเทียบที่เป็นกรรมสิทธิ์ถูกละเว้นโดยเจตนา บทความนี้มีจุดมุ่งหมายเพื่อเป็นการสื่อสารสาธารณะที่เข้มงวดเกี่ยวกับรากฐานการวิจัยของระบบมากกว่าคำแนะนำในการทำซ้ำ
1. บทนำ
ปัจจุบันการค้าปลีกออนไลน์กลายเป็นอุตสาหกรรมที่มีมูลค่า 6.3 ล้านล้านเหรียญสหรัฐ ซึ่งดูดซับเงินค้าปลีกประมาณหนึ่งในหกที่ใช้ไปทั่วโลก [6], [22] ภายในนั้น การกระจายความสามารถในการวิเคราะห์เป็นแบบสองรูปแบบอย่างรวดเร็ว: ผู้ค้าปลีกระดับแพลตฟอร์มกลุ่มเล็กๆ ดำเนินการชุดข้อมูลการตัดสินใจแบบ end-to-end ในขณะที่ผู้ขายในตลาดกลางและขนาดเล็กส่วนใหญ่ขึ้นอยู่กับสเปรดชีต วิดเจ็ตแดชบอร์ด และสัญชาตญาณ [7] ช่องว่างในการตัดสินใจและสติปัญญา — ความแตกต่างระหว่างพฤติกรรมผู้ขายที่ดีที่สุดและสังเกตได้เกี่ยวกับมาตรการเชิงพาณิชย์ เช่น ราคา การส่งเสริมการขาย และการใช้จ่ายโฆษณา — ได้รับการบันทึกไว้ในเชิงปริมาณในงานสำรวจ และเป็นที่เข้าใจกันอย่างกว้างขวางว่าเป็นส่วนแบ่งที่มีความหมายของการมีส่วนร่วมที่สูญเสียไปโดยผู้ขาย SMB ในแต่ละปี [7], [10], [17]
ภายในช่องว่างนี้ การจัดสรรงบประมาณการโฆษณาเป็นปัญหาเฉียบพลันโดยเฉพาะอย่างยิ่งด้วยเหตุผลเชิงโครงสร้างสามประการ ประการแรก บนแพลตฟอร์มตลาดสมัยใหม่ ผู้ขายไม่ได้เสนอราคา: แพลตฟอร์มเป็นผู้เสนอราคา ผู้ขายควบคุมเฉพาะงบประมาณรายวันและ ROAS เป้าหมาย และอัลกอริธึมการเสนอราคาอัตโนมัติของแพลตฟอร์มจะตัดสินใจคำหลัก ผู้ชม ตำแหน่ง และอัตรา [1], [4] ประการที่สอง แพลตฟอร์มไม่ชัดเจน: ไม่มีการเปิดเผยกลไกการประมูล อัลกอริธึมการจับคู่ และคะแนนความเกี่ยวข้อง ดังนั้นผู้ขายจึงสังเกตเฉพาะการแมปอินพุตและเอาท์พุตเท่านั้น ซึ่งโครงสร้างภายในจะต้องอนุมานจากข้อมูล [21], [25] ประการที่สาม แพลตฟอร์มจะลงโทษการแทรกแซงความถี่สูงอย่างแข็งขัน ผ่านการหยุดช่วงการเรียนรู้ หน้าต่างการเปลี่ยนแปลงขั้นต่ำ และการควบคุมความเร็ว ดังนั้นการตอบสนองที่ชัดเจน — เสนอราคาให้หนักขึ้น และปรับแต่งใหม่ให้บ่อยขึ้น — ในทางปฏิบัติ ต่อต้าน [1], [3], [5]
บทความนี้จัดทำเอกสารว่า DataGlass ซึ่งเป็นระบบอัจฉริยะในการตัดสินใจด้านการผลิตซึ่ง ณ ไตรมาสที่ 1 ปี 2569 บริหารจัดการงบประมาณสำหรับผู้ขายที่ใช้งานอยู่หลายร้อยรายในตลาดเอเชียตะวันออกเฉียงใต้ที่สำคัญ จัดการกับโครงสร้างข้อจำกัดนี้ได้อย่างไร การมีส่วนร่วมของบทความนั้น แตกต่างจากงานระเบียบวิธีพื้นฐานที่มีสองเท่า:
1. เรากำหนดลักษณะของ พื้นฐานก่อนอัลกอริธึม — กลุ่มของการศึกษาสำนึกแบบแมนนวลที่ผู้ขายรายย่อยใช้ในปัจจุบัน — โดยมีความแม่นยำเชิงปริมาณเพียงพอที่จะทำให้โหมดความล้มเหลวชัดเจน โดยเฉพาะอย่างยิ่ง เราจัดช่องว่างระหว่าง ROAS ที่รายงานกับ ROAS ที่ปรับส่วนต่างตามจริงและแสดงให้เห็นว่าการคาดการณ์ค่าเฉลี่ยแบบกลิ้งภายใต้ช่องว่างนี้เป็นตัวประมาณค่าที่มีอคติเชิงเส้นกำกับของกำไรส่วนเพิ่มต่อดอลลาร์
2. เราสรุปหลักระเบียบวิธีของ DataGlass ในระดับที่จำเป็นในการประเมินตำแหน่งทางวิทยาศาสตร์ ในขณะที่ระงับการสอบเทียบที่เป็นกรรมสิทธิ์ ซึ่งทำให้ระบบการผลิตแตกต่างจากการนำตำราเรียนไปใช้
ส่วนที่เหลือของบทความมีการจัดระเบียบดังนี้ ส่วนที่ 2 สำรวจแนวทางปฏิบัติในอดีตและปัจจุบันของการจัดการงบประมาณโฆษณาด้วยตนเอง ส่วนที่ 3 มาจากเหตุผลเชิงวิเคราะห์ที่ทำให้การปฏิบัติล้มเหลว ส่วนที่ 4 แก้ไขสัญกรณ์และระบุปัญหาการปรับให้เหมาะสมอย่างเป็นทางการ ส่วนที่ 5 ทบทวนวรรณกรรมทางวิชาการที่เกี่ยวข้อง ส่วนที่ 6 อธิบายระบบ DataGlass ในระดับสูง ส่วนที่ 7 กล่าวถึงตำแหน่งและลักษณะทั่วไป ส่วนที่ 8 และ 9 ครอบคลุมถึงข้อจำกัดและข้อสรุป การอ้างอิงเป็นไปตามรูปแบบตัวเลขของ IEEE
2. ยุคก่อนอัลกอริทึม: วิธีที่ผู้ขายเสนอราคาโดยไม่มีการเพิ่มประสิทธิภาพ
ในยุคตลาดหลังปี 2015 ส่วนใหญ่ การตัดสินใจเรื่องงบประมาณโฆษณาฝั่งผู้ขายนั้นดำเนินการโดยมนุษย์ที่ทำงานบนสเปรดชีต แดชบอร์ด และสัญชาตญาณ ฮิวริสติกสามตระกูลมีอิทธิพลเหนือ
2.1 การจัดสรรใหม่แบบลองผิดลองถูก
รูปแบบที่พบบ่อยที่สุดในการสำรวจผู้ขายที่สังเคราะห์โดย Jungle Scout [10], Shopify Commerce Trends [17] และดัชนี McKinsey SMB [13] คือการกวาดล้างด้วยตนเองรายสัปดาห์หรือสองครั้งต่อสัปดาห์: ผู้ขายเปิดแดชบอร์ดตลาด จัดเรียงแคมเปญตาม ROAS ที่รายงาน เพิ่มงบประมาณในแคมเปญควอไทล์สูงสุดด้วยเปอร์เซ็นต์คงที่ (โดยทั่วไป 10–30%) ลดหรือหยุดควอไทล์ด้านล่างชั่วคราว และ จะกลับมาอีกครั้งในสัปดาห์หน้า ไม่มีแบบจำลองของความสัมพันธ์ระหว่างการตอบสนองต่องบประมาณ ไม่มีการวัดปริมาณของความไม่แน่นอน และไม่มีการแยกสัญญาณออกจากสัญญาณรบกวน สมมติฐานโดยนัยคือ ROAS ที่รายงานของเมื่อวานเป็นตัวทำนายที่ดีของ ROAS ส่วนเพิ่มของวันพรุ่งนี้ ซึ่งเป็นสมมติฐานที่เราแสดงในส่วนที่ 3 ล้มเหลวอย่างเป็นระบบและไม่สมมาตร
ผลการดำเนินงานได้รับการบันทึกไว้อย่างดี การแก้ไขงบประมาณบ่อยครั้งจะทำให้เกิดการรีเซ็ตขั้นตอนการเรียนรู้ฝั่งแพลตฟอร์ม ในระหว่างที่โปรแกรมเสนอราคาอัตโนมัติรวบรวมข้อมูลการสำรวจใหม่ๆ และราคาต่อหนึ่งคลิกที่มีประสิทธิผลของแคมเปญจะเพิ่มขึ้น [1, §3] ผู้ขายสังเกตเห็นประสิทธิภาพที่ลดลง ตอบสนองต่อการแก้ไขเพิ่มเติม และสร้างวงจรการปั่นเสริมด้วยตนเองขึ้น การประมาณการเชิงประจักษ์จากการตรวจสอบภายใน DataGlass ของบัญชีผู้ขายที่ไม่มีการจัดการ แนะนำว่า 30–55% ของการแก้ไขงบประมาณด้วยตนเองทั้งหมดที่ทำในระหว่างช่วงการเรียนรู้นั้นเป็นค่าลบสุทธิในการสนับสนุนที่คาดหวัง
2.2 การคาดการณ์ค่าเฉลี่ยแบบโรลลิ่ง
ผู้ขายที่มีตัวเลขมากกว่าจะใช้ค่าเฉลี่ยแบบต่อเนื่อง (โดยทั่วไปคือ 7 วันหรือ 14 วัน) ของ ROAS ของแดชบอร์ดหรือรายได้ต่อแคมเปญ และใช้เป็นค่าประมาณสำหรับประสิทธิภาพในวันถัดไป ปล่อย แสดงถึง ROAS ที่รายงานในวันนั้น และ ท้าย- หมายถึง,
ผู้ขายจึงกำหนดงบประมาณของวันพรุ่งนี้ตามสัดส่วน:
ที่ไหน คือค่าเฉลี่ยทั้งพอร์ตโฟลิโอ นี่คือ เครื่องมือเพิ่มประสิทธิภาพพอร์ตโฟลิโอของคนจน: โดยจะจัดสรรใหม่ให้กับแคมเปญที่มีผลตอบแทนที่รายงานล่าสุดสูงกว่าค่าเฉลี่ย มันมีระเบียบวินัยมากกว่าสัญชาตญาณบริสุทธิ์ แต่ก็มีพยาธิวิทยาทุกอย่างของตัวประมาณค่าค่าเฉลี่ยเคลื่อนที่บนสัญญาณที่ไม่นิ่ง เซ็นเซอร์ และแสดงที่มาล่าช้า และดังที่เราแสดงด้านล่าง มันมีอคติไปในทิศทางที่ให้รางวัลอย่างเป็นระบบกับแคมเปญที่มีส่วนร่วมน้อย
2.3 ความรู้สึกและสัญชาตญาณ
แนวทางปฏิบัติประการที่สาม ซึ่งมักจะอยู่ร่วมกับสองประการแรกคือสัญชาตญาณ: ผู้ขาย "รู้" ว่าแคมเปญกำลังไปได้ดีเนื่องจากมีคำสั่งซื้อที่วุ่นวายเมื่อเร็ว ๆ นี้ หรือ "รู้สึก" ว่าคู่แข่งกำลังก้าวร้าวใน SKU ใดรายการหนึ่งโดยเฉพาะ มีวรรณกรรมเศรษฐศาสตร์พฤติกรรมที่สำคัญที่บันทึกไว้ว่ามนุษย์มีปฏิกิริยาเกินเหตุอย่างเป็นระบบต่อการเสริมแรงล่าสุด อัตราฐานน้ำหนักต่ำกว่า และสร้างความสับสนกับความแปรปรวนด้วยสัญญาณ โปรดดูการสำรวจโดย Kahneman [12] และงานโฆษณาเชิงทดลองของ Lewis และ Rao [14] ซึ่งแสดงให้เห็นว่าอัตราส่วนสัญญาณต่อเสียงรบกวนในการวัดโฆษณาเชิงสังเกตการณ์นั้นไม่เอื้ออำนวยอย่างยิ่ง จนโดยทั่วไปแล้วจะไม่สนับสนุนการกล่าวอ้างเชิงสาเหตุที่ทำให้เกิดความมั่นใจจากผู้ขาย SMB ด้วยข้อมูลของตนเอง
2.4 ต้นทุนรวมของพื้นฐานก่อนอัลกอริทึม
ผลกระทบทางเศรษฐกิจโดยตรง ผู้ขาย SMB ใช้เวลาโดยประมาณในสหรัฐฯ$80–110 billion on marketplace ads in 2024 [22]. Conservatively, if 15–25% of that spend is misallocated by the heuristics in sections 2.1–2.3, the deadweight loss is on the order of US$12–28 พันล้านต่อปี นี่คือพื้นผิวที่สามารถโต้แย้งได้ซึ่งระบบการตัดสินใจและสติปัญญากล่าวถึง
3. เหตุใดการวิเคราะห์พฤติกรรมด้วยตนเองจึงล้มเหลว: ช่องว่าง True-ROAS และอคติแบบ Rolling-Mean
ตอนนี้เราได้จัดรูปแบบความล้มเหลวหลักสองโหมดของพื้นฐานก่อนอัลกอริทึมอย่างเป็นทางการ
3.1 ช่องว่าง ROAS ที่รายงานเทียบกับจริง
รูปแดชบอร์ดที่แสดงให้ผู้ขายเห็นคือ
นี่ไม่ใช่*การวัดผลกำไร ส่วนต่างส่วนต่างที่แท้จริงของผู้ขายจากค่าโฆษณาส่วนเพิ่มจะต้องสุทธิจากต้นทุนสินค้าที่ขาย ค่าคอมมิชชันของแพลตฟอร์ม การประมวลผลการชำระเงิน เงินอุดหนุนสำหรับการปฏิบัติตาม และการสูญเสียคืนสินค้าหลังการขาย ปล่อย แสดงถึงอัตรากำไรขั้นต้นในตะกร้า สัดส่วนค่าธรรมเนียมแพลตฟอร์มแบบรวมทั้งหมด อัตราผลตอบแทนหลังการขาย และ เศษส่วนของค่าใช้จ่ายในการปฏิบัติตามและการชำระเงิน ROAS ที่ปรับด้วยกำไรจริง มีค่าประมาณ
สำหรับผู้ขายเครื่องแต่งกายทั่วไปในเอเชียตะวันออกเฉียงใต้ด้วย , , $f + \rho \approx 0.17$ROAS ที่รายงาน เท่ากับ 5.0× สอดคล้องกับ ROAS จริง ที่ประมาณ
นั่นคือ ตัวคูณการมีส่วนร่วม 1.53× จากค่าใช้จ่ายในการโฆษณา แทนที่จะเป็นพาดหัว 5× แคมเปญที่รายงาน ROAS 2.5 เท่า ซึ่งผู้ขายส่วนใหญ่จะถือว่ามีสุขภาพที่ดี มีตัวคูณการมีส่วนร่วมจริงประมาณ 0.77 เท่า กล่าวคือ เป็นการขาดทุนในทุก ๆ ดอลลาร์ส่วนเพิ่ม ปรากฏการณ์นี้ไม่ได้บอบบาง มันเป็นโครงสร้าง และไม่สามารถมองเห็นได้บนแดชบอร์ดตลาดมาตรฐานใดๆ ดูการรักษาได้ยาวนานขึ้นใน the true-ROAS reconstruction note สำหรับตัวอย่างผลงานเฉพาะของ Shopee และ contribution margin สำหรับคำจำกัดความตามรูปแบบบัญญัติ
เลขคณิตเดียวกันมีลักษณะทั่วไปในหมวดหมู่ต่างๆ สำหรับอุปกรณ์อิเล็กทรอนิกส์สำหรับผู้บริโภคที่ไหน มักจะอยู่ที่ 0.10–0.20 ROAS คุ้มทุน ที่รายงาน อยู่ในช่วง 6–10× สำหรับ SKU ความงามที่มีอัตรากำไรสูงซึ่งมีอัตราผลตอบแทนต่ำ จะอยู่ใกล้กับ 2× ดังนั้น ROAS ที่รายงานถึงจุดคุ้มทุนจึงแตกต่างกันไปตามลำดับความสำคัญในหมวดหมู่ต่างๆ แต่ผู้ขายมักใช้จุดตัดแดชบอร์ดเดียว (โดยทั่วไปคือ 3× หรือ 4×) ในพอร์ตการลงทุนที่ต่างกัน
3.2 เหตุใดการอนุมานค่าเฉลี่ยแบบกลิ้งจึงมีอคติ
พิจารณาแคมเปญที่ความสัมพันธ์ระหว่างงบประมาณและรายได้ที่แท้จริงเว้ากับผลตอบแทนที่ลดลง - เชิงประจักษ์คือเส้นโค้งแบบเนินเขาที่อิ่มตัว [9], [16]:
ดังนั้นฟังก์ชันรายได้ที่สอดคล้องกัน ก็เว้าเหมือนกัน โดยที่ คืออัตราการแปลงและ คือมูลค่าการสั่งซื้อเฉลี่ย ROAS ส่วนเพิ่มตามงบประมาณ เป็น
นี่คือปริมาณที่การจัดสรรแบบเพิ่มผลกำไรสูงสุดต้องทำให้เท่ากันในแคมเปญต่างๆ ในทางตรงกันข้าม ROAS เฉลี่ย ที่รายงานคือ
ซึ่งเป็นผลตอบแทน เฉลี่ย ต่อดอลลาร์ ไม่ใช่ผลตอบแทนส่วนเพิ่ม ตามอาร์กิวเมนต์ความเว้ามาตรฐาน ค่าเฉลี่ยจะเกินขอบเขตเมื่อใดก็ตามที่เส้นโค้งเว้า และช่องว่าง
คือการใช้จ่ายแบบโมโนโทนที่เพิ่มขึ้นเหนือระบอบการปกครองที่อิ่มตัว ตัวประมาณค่าเฉลี่ยต่อเนื่องที่กำหนดเป้าหมายโดยเฉลี่ยมากกว่า ROAS ส่วนเพิ่ม จึงจัดสรรมากเกินไปให้กับแคมเปญที่อิ่มตัวแล้ว เนื่องจาก ROAS เฉลี่ย ยังคงสูงแม้ว่า ROAS ส่วนเพิ่ม เข้าใกล้ศูนย์ก็ตาม นี่เป็นกลไกการวิเคราะห์ที่อยู่เบื้องหลังการสังเกตเชิงประจักษ์ว่าแคมเปญที่ใช้จ่ายสูงภายใต้การจัดการด้วยตนเองแสดงการมีส่วนร่วมที่ลดลงแม้จะมีตัวชี้วัดแดชบอร์ดที่เสถียร [1, §X] เอกสารที่นำมาใช้ — การปรับเส้นโค้ง ROAS ส่วนเพิ่มข้ามแพลตฟอร์มให้เท่ากัน แทนที่จะจัดสรรตามส่วนแบ่งรายได้ในอดีต — ได้รับการบันทึกไว้ใน the cross-platform ad-budget allocation note.
3.3 เวลาในการตอบสนองของการระบุแหล่งที่มาและปัญหาเสียงรบกวน
ประเด็นที่สองทำให้เกิดอคติ โดยทั่วไปแพลตฟอร์ม Marketplace จะเครดิตการซื้อให้กับโฆษณาภายในกรอบเวลาการระบุแหล่งที่มา 7–14 วัน [21] ROAS ที่รายงานในวันนั้น จึงผสมกลุ่มประชากรตามรุ่นการคลิกจากวันต่างๆ ผ่าน ด้วยน้ำหนักที่ไม่สำคัญและการเปิดเผยบางส่วนของกลุ่มตามรุ่นในแต่ละวัน ค่าเฉลี่ยแบบต่อเนื่อง 7 วันของ ROAS รายวันที่มีการระบุแหล่งที่มาบางส่วนคือการบิดตัวของเคอร์เนลที่ปรับให้เรียบสองอันและรับช่วงความล่าช้าของเฟสประมาณ 4–7 วัน สัมพันธ์กับ ROAS ส่วนเพิ่มรายวันที่แท้จริง ผู้ขายที่ตอบสนองต่อสัญญาณที่ล่าช้านี้ไล่ล่าระบอบการปกครองก่อนหน้านี้ได้อย่างมีประสิทธิภาพ และความสัมพันธ์อัตโนมัติที่เกิดจากการผสมผสานการระบุแหล่งที่มามักเข้าใจผิดว่าเป็นสัญญาณของแท้ — ปัญหาการถดถอยแบบหลอกๆ ในตำราเรียนในแง่ของ Granger และ Newbold
Lewis และ Rao [14] สร้างผลลัพธ์ เศรษฐศาสตร์ที่ไม่พึงประสงค์ของการวัดผลการโฆษณา: สำหรับปริมาณการโฆษณา SMB โดยทั่วไป ข้อผิดพลาดมาตรฐานของการประมาณค่า ROAS แบบสังเกตมีขนาดใหญ่พอที่จะประมาณจุดภายใน แยกไม่ออกจากค่าว่างในทางสถิติ ผู้ขายที่ไม่มีการระบุปริมาณความไม่แน่นอนจึงทำการตัดสินใจเกี่ยวกับสัญญาณที่อยู่ต่ำกว่าระดับเสียงรบกวนของตนเองอย่างเป็นทางการ
3.4 การลดสัดส่วนสินค้าคงคลังและการเสื่อมสภาพของ CVR
เอฟเฟกต์ประสมประการที่สาม บันทึกโดย Ma และคณะ [15] สำหรับโฆษณาบนการค้นหาของ Taobao คืออัตรา Conversion ลดลงเมื่อปริมาณการคลิกเกินขนาดสินค้าคงคลังหรือความสามารถในการเติมเต็มของผู้ขาย ปล่อย แสดงถึงการใช้แคมเปญ
ที่ไหน เป็นฟังก์ชันการลดสัดส่วนแบบโมโนโทนที่สูงกว่าเกณฑ์เฉพาะแคมเปญ การวิเคราะห์พฤติกรรมแบบ Rolling-mean ซึ่งถือว่า มีค่าคงที่ จะระบุผลตอบแทนส่วนเพิ่มของแคมเปญที่เพิ่มงบประมาณเกินเกณฑ์อย่างเป็นระบบ ปัญหาการดำเนินงานที่เชื่อมต่อ — เมื่อปริมาณโฆษณาปรับขนาดเป็น stockout หน้าต่าง — ได้รับการปฏิบัติในเชิงปริมาณใน the stockout-cost note.
3.5 ต้นทุนคอมโพสิต
โดยรวมแล้ว การวิเคราะห์พฤติกรรมแบบแมนนวลเป็นตัวประมาณค่าส่วนเพิ่มที่มีอคติ เนื่องจาก (i) สร้างความสับสนให้กับรายงานด้วย ROAS ที่แท้จริง (ii) สร้างความสับสนให้กับค่าเฉลี่ยด้วยส่วนเพิ่ม (iii) ละเว้นเวลาในการตอบสนองของแหล่งที่มา (iv) เพิกเฉยต่อการลดสัดส่วนสินค้าคงคลัง และ (v) เพิกเฉยต่อต้นทุนด้านแพลตฟอร์มของการปั่นราคาเสนอ ระบบ DataGlass จัดการกับแต่ละสิ่งเหล่านี้อย่างชัดเจน สรุปการปรับโครงสร้าง — การเปลี่ยนจากโมเดลแดชบอร์ดไปเป็นโมเดลการตัดสินใจ the decision-engine architecture note.
4. การกำหนดปัญหา
เรานำสัญลักษณ์ของรายงานทางเทคนิคที่เกี่ยวข้องมาใช้ [1], [5] อนุญาต จัดทำดัชนีแคมเปญที่ใช้งานอยู่ของผู้ขายและปล่อยให้ แสดงถึงงบประมาณรายวันในแต่ละวัน . ปัญหาการตัดสินใจในแต่ละเช้าคือการเลือกเวกเตอร์ ที่เพิ่มผลกำไรพอร์ตโฟลิโอที่คาดหวังสูงสุดภายใต้ข้อจำกัดในการดำเนินงาน
กำไรที่คาดหวังของแคมเปญ ตามงบประมาณ ยอมรับการสลายตัว
ที่ไหน คือคลิกที่คาดหวัง (จำลองเป็นกระบวนการนับลบ-ทวินามเพื่อดูดซับการกระจายตัวมากเกินไป [8], [23]) คืออัตราการแปลง (จำลองเป็นเบต้า–ทวินามที่มีการเจือจางตามการใช้งาน [15]) คือการใช้จ่ายที่รับรู้ (ใกล้เคียงแต่ไม่เท่ากันกับงบประมาณภายใต้การกำหนดความเร็วของแพลตฟอร์ม) คือค่าคอมมิชชันแพลตฟอร์มและค่าธรรมเนียม และ คือตัวคูณอัตรากำไรขั้นต้นที่แนะนำในส่วนที่ 3.1
ปัญหาพอร์ตโฟลิโอก็คือ
ที่ไหน คือมูลค่าสูงสุดของพอร์ตโฟลิโอรายวันและ เข้ารหัสความเป็นไปได้ต่อแคมเปญ — ขั้นต่ำของงบประมาณ การหยุดช่วงการเรียนรู้ หน้าต่างความเสถียร ขีดจำกัดการนับการดำเนินการ และรั้ว ROAS องค์ประกอบที่แน่นอนของ เป็นส่วนหนึ่งของข้อกำหนดที่เป็นกรรมสิทธิ์และได้รับการบันทึกไว้ภายใน [3]–[5]
ภายใต้การปรับสภาพภายในให้เหมาะสมที่สุด เงื่อนไขลำดับแรกจะให้คุณลักษณะ กำไรส่วนเพิ่มเท่ากัน:
ที่ไหน คือราคาเงาบนข้อจำกัดด้านงบประมาณและ คือชุดของแคมเปญที่ไม่ได้อยู่ในข้อจำกัดความเป็นไปได้ที่มีผลผูกพัน ราคาเงา มีการตีความทางเศรษฐกิจที่สะอาดในฐานะส่วนเพิ่มของพอร์ตโฟลิโอดอลลาร์ถัดไป การทำให้ผู้ขายมองเห็นวัตถุนี้ถือเป็นการปรับปรุงที่ไม่สำคัญเหนือพื้นฐานการศึกษาสำนึก
5. รากฐานระเบียบวิธี
วิธีการที่เป็นรากฐานของ DataGlass นำมาจากวรรณกรรมสี่เนื้อหา
การสร้างแบบจำลองเส้นโค้งการตอบสนอง ฟังก์ชันความอิ่มตัวของ Hill มีต้นกำเนิดมาจากเภสัชวิทยา [16] และกลายเป็นมาตรฐานในการสร้างแบบจำลองส่วนประสมการตลาดสมัยใหม่ผ่านกรอบงาน Robyn ของ Google [11] และระบบ Meridian ของ Meta แบบฟอร์ม Michaelis–Menten เป็นกรณีพิเศษ (); กฎกำลังคือขีดจำกัดงบประมาณเล็กๆ น้อยๆ Naik และ Raman [18] ขยายสิ่งเหล่านี้ไปสู่การทำงานร่วมกันด้านมัลติมีเดีย การนับคลิกที่กระจายมากเกินไปได้รับการจัดการผ่านการกำหนดพารามิเตอร์เชิงลบทวินาม (NB2) [8], [23] โดยมีการทดสอบการกระจายเกินตามเจตนารมณ์ของคณบดี [9] อัตราการแปลงได้รับการจำลองเป็นเบต้า–ทวินามโดยมีการเจือจางตามการใช้งาน [15] ริชาร์ดสัน และคณะ [21] จัดเตรียมงานทำนายอัตราการคลิกผ่านพื้นฐานสำหรับระบบการเริ่มเย็น
การเพิ่มประสิทธิภาพที่มีข้อจำกัดและการโจรกรรมด้วยเป้สะพายหลัง ภายใต้ข้อจำกัดด้านงบประมาณ ปัญหาจะอยู่ภายในกรอบการทำงาน Bandits-with-Knapsacks (BwK) [20] ซึ่งความเสียใจจะขยายขนาดตามอัตราส่วนที่เหมาะสมต่องบประมาณ เฮย์มันน์ และคณะ [25] ศึกษากลุ่มmulti-armed banditsแบบผสมผสานเพื่อการจัดสรรพอร์ตโฟลิโอ ความเสียใจแบบไดนามิกภายใต้ความไม่คงที่เป็นไปตาม Besbes และคณะ [26] มีขอบเขต
ที่ไหน คือความแปรผันของเส้นทาง เฉินและคณะ [27] เพิ่มความคมชัดให้กับสิ่งนี้ เมื่อปรับสภาพข้อมูลด้านข้าง บัลเซโร และคณะ [28], [29] พัฒนา dual mirror descent สำหรับการจัดสรรออนไลน์พร้อมทั้งเสียใจและรับประกันการละเมิดข้อจำกัด ซึ่งเกี่ยวข้องโดยตรงกับข้อจำกัด ROI ต่อแคมเปญในการตั้งค่าของเรา
การสำรวจภายใต้ความไม่แน่นอน Thompson Sampling ประสบความเสียใจ ในmulti-armed bandits [30] และเหนือกว่าเชิงประจักษ์ภายใต้ข้อเสนอแนะที่ล่าช้าและการระบุโมเดลที่ไม่ถูกต้อง [31], [32] โอหยาง และคณะ [33] ขยาย Thompson Sampling ไปสู่ MDP ที่ไม่รู้จัก Jauvion และคณะ [34] ปรับใช้สำหรับการเสนอราคาส่วนหัวในแพลตฟอร์มฝั่งอุปทานโดยแสดงให้เห็นผลกำไรระดับการผลิตเหนือ UCB
การตรวจจับจุดเปลี่ยน CUSUM เป็นขั้นตอนการตรวจจับออนไลน์แบบคลาสสิก [19] ที่มีคุณสมบัติความยาวเฉลี่ย (ARL) ที่เข้าใจกันดี [24] การเรียกซ้ำคือ
ที่ไหน เป็นปริมาณคงเหลือที่ได้มาตรฐานและ ได้รับการปรับเทียบกับ ARL เป้าหมายผ่านการประมาณของ Siegmund [24] ทางเลือกสมัยใหม่ ได้แก่ การตรวจจับจุดเปลี่ยนออนไลน์แบบเบย์ [35] และวิธีการที่ใช้เคอร์เนลที่สำรวจใน Aminikhanghahi และ Cook [36]
การระบุสาเหตุ Gordon และคณะ [37] สร้างมาตรฐานทองคำของการทดลองแบบสุ่มสำหรับการวัดผลการโฆษณา ลูอิสและราว [14] บันทึกเศรษฐศาสตร์สัญญาณต่อเสียงรบกวนที่ไม่เอื้ออำนวยของการวัดเชิงสังเกตการณ์ Oster [38] ให้การวิเคราะห์ความไวสำหรับอาการสับสนที่ไม่มีใครสังเกตเห็น โบรเดอร์เซ่น และคณะ [39] พัฒนาอนุกรมเวลาเชิงโครงสร้างแบบเบย์สำหรับผลกระทบเชิงสาเหตุ DataGlass ผสมผสานการก่อกวนแบบสุ่มในอนาคต และการวิเคราะห์ความไวแบบ Oster [1, §VIII]
6. ระบบ DataGlass
เราอธิบายระบบในระดับสูงสุดที่สอดคล้องกับความเข้มงวดที่จำเป็นสำหรับการสื่อสารทางวิชาการ พารามิเตอร์การปรับแต่งที่เป็นกรรมสิทธิ์ องค์ประกอบข้อจำกัดที่แม่นยำ การออกแบบการทดลองก่อกวน และค่าเริ่มต้นเฉพาะเซ็กเมนต์จะไม่ถูกเปิดเผยที่นี่ มีการบันทึกไว้ใน [2]–[5] และในข้อกำหนดทางวิศวกรรมการผลิต
6.1 องค์ประกอบที่ 1 — โมเดลการตอบสนองแบบเบย์
สำหรับแต่ละแคมเปญ , DataGlass จะรักษาการกระจายแบบหลังไว้ , ที่ไหน คือพารามิเตอร์การกระจายตัวของ NB2 โมเดลการคลิกใช้ความน่าจะเป็นเชิงลบ-ทวินามกับความอิ่มตัวของฮิลล์ โมเดลการแปลงใช้ความน่าจะเป็นแบบเบต้า-ทวินามพร้อมการเจือจางตามการใช้งาน การประมาณค่าเป็นสองขั้นตอนพร้อมการรักษาเสถียรภาพของสันในระยะการคลิกและการอัปเดตแบบรวมในขั้นตอนการแปลง ข้อผิดพลาดมาตรฐานถูกแพร่กระจายโดยใช้การแก้ไข Murphy-Topel [40] ซึ่งมีรูปแบบการแยกตัวประกอบที่แน่นอนในการตั้งค่าของเรา เนื่องจากเงื่อนไขสองขั้นตอนคือสถิติที่แยกจากกันอย่างเพียงพอ [1, §VI]
ตัวเลือกการออกแบบที่สำคัญคือ การอัพเกรด Hill แบบมีเงื่อนไข: เส้นโค้งอิ่มตัวจะถูกติดตั้งเฉพาะเมื่อช่วงงบประมาณล่าสุดของแคมเปญเป็นไปตามที่พอใจ และขนาดตัวอย่างที่มีประสิทธิผลเกินเกณฑ์ความสามารถในการระบุตัวตน [1, §VI.B]; มิฉะนั้น จะใช้รูปแบบพาราเมตริกแบบอนุรักษ์นิยมมากกว่า สิ่งนี้กล่าวถึงข้อกังวลด้านโครงสร้างและเชิงปฏิบัติโดยตรงที่เกิดขึ้นใน Raue และคณะ [41] และหลีกเลี่ยงความพอดีที่เป็นระบบซึ่งเกิดขึ้นเมื่อพารามิเตอร์ความอิ่มตัวแบบไม่เชิงเส้นถูกประเมินจากข้อมูลที่แปรผันไม่เพียงพอ
6.2 องค์ประกอบ 2 — เครื่องมือเพิ่มประสิทธิภาพพอร์ตโฟลิโอที่มีข้อจำกัด
เมื่อพิจารณาจากด้านหลัง เครื่องมือเพิ่มประสิทธิภาพจะแก้ปัญหาโปรแกรมของส่วนที่ 4 โครงสร้างชุดที่ใช้งานอยู่ถูกใช้ประโยชน์โดยการลดปัญหาให้เป็นการค้นหาราคาเงาในมิติเดียว :
แก้ไขโดยการแบ่งส่วน ความแตกต่างโดยนัยของ ด้วยความเคารพต่อพารามิเตอร์ด้านหลังจะแพร่กระจายความไม่แน่นอนไปสู่งบประมาณที่แนะนำ ดังนั้นทุกๆ ผลลัพธ์จะมาพร้อมกับช่วงเวลาที่น่าเชื่อถือมากกว่าการประมาณจุด องค์ประกอบข้อจำกัดแบบเต็ม จำนวนการดำเนินการสูงสุด และกฎไทเบรกระหว่างข้อจำกัดที่มีผลผูกพันพร้อมกันไม่ได้ถูกบันทึกไว้ที่นี่ อะนาล็อกที่ใช้ — แปลมุมมองราคาเงาเป็นการดำเนินการที่ผู้ขายต้องเผชิญ — มีภาพประกอบอยู่ใน the ads-optimisation solution surface.
6.3 องค์ประกอบที่ 3 — ชั้นที่ไม่อยู่กับที่
กลไกทั้งสามทำงานร่วมกัน Thompson Sampling ให้การสำรวจตามหลักการโดยคำนึงถึง [30] เป็นพิเศษสำหรับการตั้งค่าที่มีงบประมาณจำกัดตาม Balseiro และคณะ [29]. การตรวจจับจุดเปลี่ยนแปลงตาม CUSUM สำหรับส่วนที่เหลือต่อแคมเปญจะเริ่มทำงานเมื่อเส้นโค้งการตอบสนองเปลี่ยนไป โดยมีการปรับเทียบเกณฑ์กับ ARL เป้าหมายผ่าน [24] และตารางการปรับเทียบภายใน [1, §VII.B] เครื่องมือตรวจจับระบอบการปกครองสามชั้น — Hotelling หลายตัวแปรที่รับรู้ปฏิทิน และบันทึกเหตุการณ์ภายนอก — การโหวตในโหมดการทำงานระดับวัน (เชิงรุก ระมัดระวัง เชิงสำรวจ ระงับ)
6.4 องค์ประกอบที่ 4 — การระบุสาเหตุ
เพื่อป้องกันไม่ให้ระบบเรียนรู้ความสัมพันธ์ในการตอบสนองต่องบประมาณที่สับสน DataGlass จะใช้ความแตกต่างแรกสำหรับผู้รบกวนที่เคลื่อนไหวช้า และดำเนินการทดลองการก่อกวนแบบสุ่มในอนาคต — การเปลี่ยนแปลงงบประมาณแบบสุ่มที่มีขนาดเล็ก ปรับเทียบแล้ว และจงใจ — ซึ่งสร้างการเปลี่ยนแปลงการระบุที่ชัดเจนในบริเวณใกล้เคียงของจุดปฏิบัติการปัจจุบัน ต่อไปนี้เป็นกลไกมาตรฐานทองคำสำหรับการประมาณสาเหตุ ขนาดการก่อกวน กำหนดเวลา และขั้นตอนการพับหลักฐานผลลัพธ์กลับเข้าไปด้านหลังเป็นส่วนหนึ่งของการสอบเทียบที่เป็นความลับของระบบ
7. การอภิปราย
สามแต้มสมควรได้รับการเน้นย้ำ
ประการแรก ข้อได้เปรียบเชิงประจักษ์ของ DataGlass เหนือพื้นฐานแบบแมนนวลคือ ไม่ใช่ โดยหลักแล้วเป็นฟังก์ชันของการแสดงออกของโมเดล ฟังก์ชัน Hill, Negative Binomial และ Beta-Binomial เป็นส่วนประกอบในตำราเรียน ข้อได้เปรียบมาจาก (i) การสร้างแบบจำลองวัตถุประสงค์ ที่ถูกต้อง — การสนับสนุนที่ปรับด้วยกำไรจริงมากกว่า ROAS ที่รายงาน — และ (ii) การเคารพโครงสร้างข้อจำกัดที่เกิดจากแพลตฟอร์ม โดยเฉพาะอย่างยิ่งต้นทุนของการปั่นป่วนการประมูลภายใต้กลไกขั้นตอนการเรียนรู้ ระบบ deep-RL ที่ไร้เดียงสาซึ่งเพิกเฉยต่อข้อจำกัดเหล่านี้อาจทำให้เกิดพฤติกรรมการผลิตที่แย่กว่าผู้ปฏิบัติงานแบบแมนนวลที่มีระเบียบวินัยสูง แม้ว่าจะมีฟังก์ชันการประมาณค่าที่สมบูรณ์กว่าก็ตาม ซึ่งสอดคล้องกับการค้นพบการระเหยของ Liu และคณะ [42] สำหรับการเสนอราคาแบบเรียลไทม์
ประการที่สอง มูลค่าของระบบสำหรับผู้ขายจะเป็นสีเดียวในช่องว่างระหว่าง ROAS ที่รายงานกับ ROAS จริง ผู้ขายในหมวดหมู่ที่มีอัตรากำไรต่ำและมีอัตราผลตอบแทนสูงจะได้รับประโยชน์อย่างไม่เป็นสัดส่วน เนื่องจาก ROAS ที่รายงานคุ้มทุนนั้นสูงกว่าสิ่งที่แดชบอร์ดแนะนำมาก และพื้นฐานที่กำหนดราคาพอร์ตโฟลิโอด้วยตนเองนั้นผิดพลาดอย่างรุนแรงที่สุด ผู้ขายในหมวดหมู่ที่มีอัตรากำไรสูงและผลตอบแทนต่ำจะเห็นว่าการเพิ่มขึ้นน้อยลง แม้ว่าจะยังมีสาระสำคัญอยู่ก็ตาม
ประการที่สาม วิธีการที่อธิบายไว้ในที่นี้ครอบคลุมมากกว่าแพลตฟอร์มเฉพาะที่ระบบถูกใช้งานตั้งแต่แรก อินเทอร์เฟซ — งบประมาณรายวันบวก ROAS เป้าหมาย พร้อมการเสนอราคาอัตโนมัติแบบทึบด้านแพลตฟอร์ม — ปัจจุบันเป็นรูปแบบที่โดดเด่นในตลาดหลักๆ (Shopee, Lazada, TikTok Shop, Amazon Sponsored Products, Walmart Connect, Mercado Libre Ads) ระบบที่ถือว่าอินเทอร์เฟซนี้เป็นออบเจ็กต์การสร้างแบบจำลองชั้นหนึ่ง แทนที่จะสร้างความไม่สะดวกให้กับกลุ่มเทคโนโลยีโฆษณาทั่วไป มีข้อได้เปรียบเชิงโครงสร้างที่ไม่ใช่เรื่องบังเอิญ อนุกรมวิธานเต็มรูปแบบของการตัดสินใจของผู้ขายในชั้นการตัดสินใจแบบรวมซึ่งรวมถึงการกำหนดราคา สินค้าคงคลัง การส่งเสริมการขาย และการปรับเปลี่ยนเฉพาะบุคคล ได้รับการบันทึกไว้ใน the decision-intelligence playbook.
8. ข้อจำกัดและการทำงานในอนาคต
ข้อจำกัดหลายประการได้รับการยอมรับอย่างชัดเจนใน [1, §XI] และ [5, §11]
ฟังก์ชั่น Hill สามารถระบุได้ก็ต่อเมื่อช่วงงบประมาณกว้างเพียงพอและขนาดตัวอย่างที่มีประสิทธิภาพเกินเกณฑ์ที่ปรับเทียบแล้ว หากต่ำกว่าเกณฑ์นี้ ระบบจะกลับไปใช้รูปแบบพาราเมตริกที่อนุรักษ์นิยมมากขึ้น โดยมีการลดลงที่สอดคล้องกันในการเพิ่มที่คาดหวัง การถ่วงน้ำหนักการระบุแหล่งที่มาแบบกว้าง (ปัจจุบัน ) เป็นการศึกษาพฤติกรรมและเป็นตัวเลือกสำหรับการแทนที่ด้วยโมเดล attribution-window-aware การสับสนระหว่าง Target-ROAS ได้รับการแก้ไขบางส่วนผ่านการรวมตัวแปรร่วม การรักษาเต็มรูปแบบจำเป็นต้องมีการเพิ่มประสิทธิภาพงบประมาณ และ ROAS เป้าหมายร่วมกัน ซึ่งวางแผนไว้สำหรับเวอร์ชัน 2.0 การรวมรายวันเป็นข้อจำกัด v1.0 การจัดสรรระหว่างวันอยู่ระหว่างการพัฒนา ตรวจพบการกินเนื้อคนในแคมเปญ แต่ยังไม่ได้ปรับเปลี่ยนในเครื่องมือเพิ่มประสิทธิภาพ โดยมีส่วนขยาย v1.1 ทำให้เกิดการลงโทษร่วมอย่างเป็นทางการ ที่ไหน ประมาณจากความสัมพันธ์บางส่วนเชิงลบ [43] มีการวางแผนการจัดสรรระดับกลุ่มโฆษณาสำหรับเวอร์ชัน 2.0
ประสิทธิภาพเชิงประจักษ์ที่เลวร้ายที่สุดของระบบเกิดขึ้นภายใต้การเปลี่ยนแปลงระบอบการปกครองที่เกิดขึ้นทั่วโลกพร้อมกัน (ส่งผลกระทบต่อหลายแคมเปญ) และไม่มีการแจ้งเตือน (ไม่มีปฏิทินหรือสัญญาณบันทึกเหตุการณ์) เครื่องตรวจจับระบอบการปกครองสามชั้นช่วยลดแต่ไม่ได้ขจัดความเสี่ยงนี้ ตัวตรวจจับหลายตัวแปรเชิงรุกมากขึ้นอยู่ในการวิจัย
สำหรับข้อกำหนดมาตรฐานของกรอบตัวอย่างที่อยู่ภายใต้การอ้างสิทธิ์ "ในข้อมูลของเรา" ทุกรายการในคลังข้อมูลการวิจัยของ DataGlass — ขนาดตัวอย่าง กรอบเวลา การยกเว้น กรอบเวลาการระบุแหล่งที่มา — โปรดดู DataGlass research methodology.
9. บทสรุป
ระบบอัจฉริยะในการตัดสินใจของ DataGlass เข้ามาแทนที่กลุ่มหลักที่โดดเด่นของการศึกษาพฤติกรรมการใช้งบประมาณโฆษณาแบบแมนนวล ได้แก่ การจัดสรรแบบลองผิดลองถูก การประมาณค่าแบบเฉลี่ยต่อเนื่อง และการแก้ไขการเสนอราคาที่ขับเคลื่อนด้วยสัญชาตญาณ ด้วยไปป์ไลน์การตัดสินใจแบบ Bayesian ที่สอดคล้องกันซึ่งเคารพข้อจำกัดของแพลตฟอร์มที่ผู้ขายในตลาดดำเนินการอยู่จริง เราได้แสดงให้เห็นในเชิงวิเคราะห์ว่าเส้นฐานแบบกำหนดเองนั้นมีอคติในลักษณะโครงสร้างที่สามารถระบุตัวตนได้ โดยสร้างความสับสนให้กับรายงานด้วย ROAS ที่แท้จริง ค่าเฉลี่ยกับผลตอบแทนส่วนเพิ่ม เนื่องมาจากสัญญาณที่ไม่ล่าช้า และไม่มีข้อจำกัดกับการดำเนินการที่เป็นไปได้ที่มีข้อจำกัด เราได้สรุปรากฐานด้านระเบียบวิธีของระบบทดแทนและรายงานการตรวจสอบเชิงประจักษ์ซึ่งแสดงการปรับปรุงผลกำไรพอร์ตโฟลิโอ 18–24% พร้อมความถี่ในการจัดสรรที่ลดลง การสอบเทียบที่เป็นกรรมสิทธิ์ซึ่งทำให้ระบบการผลิตแตกต่างจากการนำตำราเรียนไปใช้นั้นจงใจระงับไว้ เนื้อหาทางวิชาการได้รับการบันทึกไว้ในต้นฉบับที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิ [1]
สำหรับผู้ขาย ความหมายนั้นเกิดขึ้นโดยตรง: ระบบที่กำหนดเป้าหมายวัตถุประสงค์ที่ถูกต้องบนชุดข้อจำกัดที่ถูกต้องจะรวบรวมส่วนสนับสนุนที่ไม่มีในเชิงโครงสร้างสำหรับการดำเนินการด้วยตนเอง สำหรับสาขานี้ ความหมายก็คือ หน่วยข่าวกรองในการตัดสินใจ ที่รับรู้ถึงอินเทอร์เฟซ ซึ่งคำนึงถึงพื้นผิว API ของแพลตฟอร์มอย่างจริงจังในฐานะวัตถุการสร้างแบบจำลอง กลายเป็นขอบเขตการวิจัยที่มีผลผูกพันในการโฆษณาในตลาด
รับทราบ
ผู้เขียนขอขอบคุณทีมวิจัย DataGlass สำหรับชุดข้อเสนอ [2]–[5] คณะกรรมการตรวจสอบโดยผู้ทรงคุณวุฒิ [44], [45] สำหรับคำติชมที่สำคัญซึ่งกำหนดรูปแบบการแก้ไขครั้งที่ 1 ถึง 3 และผู้ขาย Shopee ที่เข้าร่วมที่ยินยอมให้ใช้งาน A/B แบบสด
อ้างอิง
รายงานทางเทคนิคภายใน
[1] DataGlass Research, "DataGlass: Bayesian Budget Allocation for E-Commerce Advertising Under Platform Constraints," IEEE Trans. Artif. Intell., manuscript ready for submission, March 2026.
[2] DataGlass Research, "DataGlass Ads Optimizer: Model Proposal," internal technical report, March 2026.
[3] DataGlass Research, "DataGlass Model Proposal — Revision 1," internal technical report, March 2026.
[4] DataGlass Research, "DataGlass Model Proposal — Revision 2," internal technical report, March 2026.
[5] DataGlass Research, "DataGlass Model Proposal — Revision 3 (Final)," internal technical report, March 2026.
บริบทอุตสาหกรรมและเศรษฐกิจมหภาค
[6] eMarketer / Insider Intelligence, "Worldwide retail and e-commerce sales forecast 2024–2027," 2024.
[7] J. Madsoon, "Mind the Gap: Quantifying Seller Pain in E-Commerce," DataGlass Research working paper, May 2026.
[10] Jungle Scout, "State of the Amazon Seller 2024," industry survey (), 2024.
[13] McKinsey & Co., "State of Small and Medium Business Index," 2024.
[17] Shopify, "Commerce Trends 2024," industry report ( merchants), 2024.
[22] eMarketer, "Global retail e-commerce sales 2024," industry data, 2024.
เส้นโค้งการตอบสนองและการสร้างแบบจำลองอุปสงค์
[8] A. C. Cameron and P. K. Trivedi, Regression Analysis of Count Data, 2nd ed. Cambridge Univ. Press, 2013.
[9] C. B. Dean, "Testing for overdispersion in Poisson and binomial regression models," J. Amer. Statist. Assoc., vol. 87, no. 418, pp. 451–457, 1992.
[11] Y. Jin, Y. Wang, Y. Sun, D. Chan, and J. Koehler, "Bayesian methods for media mix modeling with carryover and shape effects," Google Research, 2017.
[15] X. Ma, L. Zhao, G. Huang, Z. Wang, Z. Hu, X. Zhu, and K. Gai, "Entire space multi-task model: An effective approach for estimating post-click conversion rate," in Proc. SIGIR, 2018.
[16] C. Ritz, F. Baty, J. C. Streibig, and D. Gerhard, "Dose-response analysis using R," PLoS ONE, vol. 10, no. 12, e0146021, 2015.
[18] P. A. Naik and K. Raman, "Understanding the impact of synergy in multimedia communications," J. Marketing Res., vol. 40, no. 4, pp. 375–388, 2003.
[21] M. Richardson, E. Dominowska, and R. Ragno, "Predicting clicks: Estimating the click-through rate for new ads," in Proc. WWW, 2007.
[23] J. M. Ver Hoef and P. L. Boveng, "Quasi-Poisson vs. negative binomial regression," Ecology, vol. 88, no. 11, pp. 2766–2772, 2007.
โจร การเพิ่มประสิทธิภาพ และการเรียนรู้ออนไลน์
[20] A. Badanidiyuru, R. Kleinberg, and A. Slivkins, "Bandits with knapsacks," J. ACM, vol. 65, no. 3, pp. 1–55, 2018.
[25] B. Heymann et al., "Combinatorial bandits for budget allocation in marketplace advertising," arXiv preprint, 2025.
[26] O. Besbes, Y. Gur, and A. Zeevi, "Stochastic multi-armed-bandit problem with non-stationary rewards," in Proc. NeurIPS, 2014.
[27] Y. Chen, C. Lee, and H. Luo, "A new framework for oracle-efficient online learning with side information," in Proc. COLT, pp. 1060–1081, 2019.
[28] S. R. Balseiro, H. Lu, and V. Mirrokni, "Dual mirror descent for online allocation problems," in Proc. ICML, 2023.
[29] S. R. Balseiro, H. Lu, and V. Mirrokni, "Primal-dual budget pacing with ROI constraints," in Proc. ICML, 2024.
[30] S. Agrawal and N. Goyal, "Thompson Sampling for contextual bandits with linear payoffs," in Proc. ICML, 2013.
[31] O. Chapelle and L. Li, "An empirical evaluation of Thompson Sampling," in Proc. NeurIPS, 2011.
[32] D. J. Russo, B. Van Roy, A. Kazerouni, I. Osband, and Z. Wen, "A tutorial on Thompson Sampling," Found. Trends Mach. Learn., vol. 11, no. 1, pp. 1–96, 2018.
[33] Y. Ouyang, M. Gagrani, A. Naber, and R. Jain, "Learning unknown Markov decision processes: A Thompson Sampling approach," in Proc. NeurIPS, 2017.
[34] G. Jauvion, N. Grislain, P. Sielenou, A. Veyrat, and D. Gourru, "Optimization of an SSP's header bidding strategy using Thompson Sampling," in Proc. KDD, 2018.
การเสนอราคาแบบเรียลไทม์และการเรียนรู้การเสริมกำลัง
[42] S. Liu, C. Hua, Y. Chen, and J. Wang, "Real-time bidding strategy in display advertising: An empirical analysis," arXiv:2208.07516, 2022.
การตรวจจับจุดเปลี่ยนและการไม่นิ่ง
[19] E. S. Page, "Continuous inspection schemes," Biometrika, vol. 41, nos. 1–2, pp. 100–115, 1954.
[24] D. Siegmund, Sequential Analysis: Tests and Confidence Intervals. Springer, 1985.
[35] R. P. Adams and D. J. C. MacKay, "Bayesian online changepoint detection," arXiv:0710.3742, 2007.
[36] S. Aminikhanghahi and D. J. Cook, "A survey of methods for time series change point detection," Knowledge and Information Systems, vol. 51, no. 2, pp. 339–367, 2017.
การระบุสาเหตุและการวัดผลการโฆษณา
[14] R. A. Lewis and J. M. Rao, "The unfavorable economics of measuring the returns to advertising," Quart. J. Econ., vol. 130, no. 4, pp. 1941–1973, 2015.
[37] B. R. Gordon, F. Zettelmeyer, N. Bhargava, and D. Chapsky, "A comparison of approaches to advertising measurement," Marketing Sci., vol. 38, no. 2, pp. 193–225, 2019.
[38] E. Oster, "Unobservable selection and coefficient stability," J. Bus. Econ. Stat., vol. 37, no. 2, pp. 187–204, 2019.
[39] K. H. Brodersen, F. Gallusser, J. Koehler, N. Remy, and S. L. Scott, "Inferring causal impact using Bayesian structural time-series models," Ann. Appl. Stat., vol. 9, no. 1, pp. 247–274, 2015.
[40] K. M. Murphy and R. H. Topel, "Estimation and inference in two-step econometric models," J. Bus. Econ. Stat., vol. 3, no. 4, pp. 370–373, 1985.
การระบุตัวตนและรากฐานทางสถิติ
[41] A. Raue et al., "Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood," Bioinformatics, vol. 25, no. 15, pp. 1923–1929, 2009.
เอฟเฟกต์ข้ามช่องสัญญาณ
[43] I. M. Dinner, H. J. Van Heerde, and S. A. Neslin, "Driving online and offline sales: The cross-channel effects of traditional, online display, and paid search advertising," J. Marketing Res., vol. 51, no. 5, pp. 527–545, 2014.
รากฐานด้านพฤติกรรม
[12] D. Kahneman, Thinking, Fast and Slow. Farrar, Straus and Giroux, 2011.
เอกสารการตรวจสอบภายใน
[44] DataGlass Research, "DataGlass Model Proposal — Peer Review (R1)," internal review, March 2026.
[45] DataGlass Research, "DataGlass Model Proposal — Peer Review (R2 and R3)," internal review, March 2026.
DataGlass เป็นแพลตฟอร์มข้อมูลการตัดสินใจที่เน้นการวิจัยสำหรับผู้ขายอีคอมเมิร์ซ สำหรับการสอบถามเกี่ยวกับความร่วมมือ การบูรณาการ หรือความร่วมมือด้านการวิจัย โปรดติดต่อผู้เขียนโดยตรง บัญชีที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิของวิธีการดังกล่าวกำลังจะเปิดตัวเร็วๆ นี้ [1].