“กรมสรรพากร” ใช้เทคโนโลยีแบบไหนมาดูดข้อมูล “หาคนเลี่ยงภาษี”

ฟรีแลนซ์ - อาชีพรับจ้างอิสระ

การค้าขายสินค้าและบริการผ่านทาง “โลกออนไลน์” มักหลีกเลี่ยงการเสียภาษีได้ง่าย ทั้งรายใหญ่หรือรายย่อย ล่าสุดกรมสรรพากรประกาศว่าจะกวาดหา “กลุ่มพ่อค้า-แม่ค้าออนไลน์เลี่ยงภาษี” ด้วยระบบโปรแกรม “เว็บ สแครปปิ้ง” ที่สามารถดึงข้อมูลจากหน้าเพจเฟซบุ๊ค หรือหน้าร้านขายของในเวบไซด์ รวมถึงแอปพลิเคชั่นอื่น ๆ มาเป็นฐานข้อมูลในการตรวจสอบว่ามีใครพยายามหลีกหนีไม่ยอมจ่ายภาษีบ้าง โดยเฉพาะกลุ่มที่เน้นเก็บเงินปลายทางเพราะไม่สามารถตรวจสอบได้จากบัญชีเงินฝาก

กลายเป็นคำถามยอดฮิตว่า กรมสรรพากรใช้เทคโนโลยีแบบไหนมาดูดข้อมูล ?

เว็บ สแครปปิ้ง (web scraping) คือ วิธีการเข้าถึง “ดาต้า data ” หรือข้อมูลจำนวนมหาศาลที่มีอยู่ในเครือข่ายผู้ใช้อินเทอร์เน็ต โดยเฉพาะจากเว็บไซต์หรือสื่อสังคมออนไลน์ที่เก็บฐานข้อมูลบันทึกไว้ในไฟล์แบบ document, txt, spreadsheet, excel, sql, csv ฯลฯ ซึ่งเดี๋ยวนี้มือสมัครเล่นทั่วไปก็ไปดาวน์โหลดโปรแกรมสำเร็จรูปที่ให้ฟรีในเวบไซต์ต่าง ๆ มาใช้ดูดข้อมูลเหล่านี้ได้เลย ไม่จำเป็นต้องจ้างนักเขียนโปรแกรม

การรวบรวมข้อมูลบน “โลกออนไลน์” ที่มีอยู่จำนวนมหาศาลนั้น หากใครรู้เทคนิคหรือเป็นเซียนโปรแกรมคอมพิวเตอร์ก็ก็สามารถกวาดสกัดข้อมูลและประมวลผล วิเคราะห์ออกมาได้ไม่ยาก เช่น บริษัทที่ให้คำปรึกษาตลาดออนไลน์หลายแห่ง ก็ใช้วิธีกวาดดูดข้อมูลสินค้าหรือบริการที่ลูกค้าต้องการ แล้วเอามาวิเคราะห์ให้ลูกค้าฟังว่า กลุ่มเป้าหมาย สินค้ายอดนิยม การจัดซื้อจัดขายควรบริหารจัดการอย่างไร บางคนก็เรียกสั้น ๆ ว่า “ซอฟต์แวร์รวบรวมข้อมูล”

วันนี้หน่วยงานราชการอย่าง “กรมสรรพากร” ก็พลิกแพลงเอาระบบ “เว็บ สแครปปิ้ง” มาดูดข้อมูลว่า คนไหนขายของออนไลน์ได้เยอะแยะ มีลูกค้าติดต่อเข้ามามากมาย มีการโอนเงินหรือให้ส่งของมากน้อยแค่ไหน อยู่ในพื้นที่ใด หากพบว่ารายได้น่าจะเข้าข่ายต้องเสียภาษี ก็ให้สรรพการพื้นที่นั้นเข้าไปตรวจสอบ และเรียกมาจ่ายภาษีการค้าหรือภาษีรายได้ส่วนบุคคลให้ถูกต้อง

ที่น่าสนใจคือ ตอนนี้ผู้เชี่ยวชาญทั่วโลกกำลังตั้งคำถามว่า การใช้วิธีข้างต้นเข้าไปแอบเก็บกวาดรวบรวมข้อมูลเกี่ยวกับการพูดคุยติดต่อสั่งซื้อสินค้า การขนส่ง การโอนเงินหรือ การทำธุรกรรมต่าง ๆ ผ่านการสื่อสารทางอินเทอร์เน็ต หรือแม้แต่ดูดเอาข้อความ บทสนทนาหรือภาพถ่ายในเฟซบุ๊ค ทวิตเตอร์ อินสตราแกรม เพื่อนำไปใช้นั้นเป็นการทำผิดจริยธรรมหรือผิดกฎหมายหรือไม่ เพราะแม้เป็นข้อมูลที่ไม่ได้ตั้งค่าส่วนตัว หรือตั้งใจเปิดเผยต่อสาธารณะ (public) ก็ตาม

เช่น คดีฟ้องร้อง “บริษัท hiQ Labs” ที่ทำธุรกิจวิเคราะห์ฐานข้อมูลการจ้างงาน โดยใช้ข้อมูลจาก “LinkedIn” ที่เป็นหนึ่งในกลุ่มโซเชียลมีเดีย เน้นเชื่อมต่อเครือข่ายด้านการประกอบอาชีพและการทำธุรกิจ อธิบายง่าย ๆ คือเป็นสื่อกลางแลกเปลี่ยนข้อมูลระหว่างกลุ่มคนหรือบริษัทที่ต้องการ “จ้างงาน กับ หางาน” ตอนนี้มีสมาชิกทั่วโลก 675 ล้านคน เฉพาะในเมืองไทยไม่ต่ำกว่า 2.8 ล้านคน ทำให้ข้อมูลใน “LinkedIn” มีทั้งประวัติการศึกษา ข้อมูลส่วนตัว สถานที่ทำงาน แหล่งที่อยู่อาศัย ความเชี่ยวชาญ งานอดิเรก ฯลฯ ซึ่งส่วนใหญ่เป็นข้อมูลเปิดเผยสู่สาธารณะ ทุกคนเข้าไปอ่านได้ ไม่ถูกจำกัดเฉพาะเพื่อนหรือคนรู้จักเท่านั้น

จึงเป็นโอกาสให้ บริษัท hiQ Labs ใช้โปรแกรม “เว็บ สแครปปิ้ง” เข้าไปดูดข้อมูลเหล่านั้นออกมาวิเคราะห์แล้วขายให้กลุ่มลูกค้าที่ต้องการ LinkedIn จึงฟ้องร้องเมื่อปี 2017 ว่าเป็นการแอบนำข้อมูลไปใช้ ถือว่าทำผิดกฎหมายการฉ้อโกงทางคอมพิวเตอร์ของสหรัฐอเมริกา แต่ศาลตัดสินเมื่อปี 2019 ว่าการใช้ “เว็บ สแครปปิ้ง” ไม่ผิดเพราะเป็นการดาวน์โหลดหรือคัดลอก “ข้อมูลสาธารณะ” ที่สมาชิกผู้เป็นเจ้าของประวัติเหล่านี้อนุญาติให้ทุกคนเข้าถึงได้อยู่แล้ว เพียงแต่บริษัทนี้ไปรวบรวมของหลายคนเข้ามาไว้ด้วยกันก็เท่านั้นเอง

จากคดีตัวอย่างข้างต้น ทำให้นักกฎหมายหลายประเทศต้องรีบพลิกตำราดูว่า “บุคคลที่ 3” จะไปดักดูดข้อมูลชาวบ้านไปใช้ได้มากน้อยแค่ไหน ไม่ต่างจากที่กรมสรรพากรของไทยประกาศจะดูดข้อมูลหล่านี้เพื่อตามหาแม่ค้า-พ่อค้าจอมเบี้ยวภาษี หากในอนาคตตัวแทนผู้บริโภคไปฟ้องร้องจะทำอย่างไร

ทั้งนี้ พ.ร.บ.คอมพิวเตอร์ฯ ของไทยในมาตรา 8 ระบุไว้เพียงว่า ผู้ที่ใช้วิธีการ “ดักรับไว้ซึ่งข้อมูลคอมพิวเตอร์ของผู้อื่น” ที่อยู่ระหว่างการส่งในระบบคอมพิวเตอร์ และข้อมูลคอมพิวเตอร์ ที่มิได้มีไว้เพื่อประโยชน์สาธารณะหรือเพื่อให้บุคคลทั่วไปใช้ประโยชน์ได้ มีโทษจำคุก 3 ปี ปรับ 6 หมื่นบาท และถ้าผู้ใดจำหน่ายหรือเผยแพร่ชุดคำสั่งที่จัดทำขึ้นโดยเฉพาะเพื่อนำไปใช้เป็นเครื่องมือในการกระทำความผิดตามมาตรา 8 โทษจำคุกไม่เกิน 1 ปี หรือปรับไม่เกิน 2หมื่นบาท

คงต้องตีความต่อไปว่า “ข้อมูลที่มีไว้เพื่อประโยชน์สาธารณะหรือเพื่อให้บุคคลทั่วไปใช้ประโยชน์ได้” คืออะไรบ้าง

บริษัทข้ามชาติหลายแห่ง เริ่มใช้วิธีการเขียนนโยบายป้องกันไม่ให้ถูก “ดูดข้อมูล” เช่น เวบไซต์ Huawei ประกาศชัดเจนเลยว่า

“ข้อความ ภาพ เพลง วิดีโอ ภาพเคลื่อนไหว เครื่องหมายการค้า รูปแบบ แผนภูมิ ส่วนติดต่อที่เป็นภาพ และรหัสทั้งหมด…ถือเป็นกรรมสิทธิ์ตามกฎหมายโดย Huawei ใครจะนำไปใช้เพื่อจุดประสงค์ทางการค้าใดๆ ไม่ได้หากไม่ได้รับความยินยอมเป็นลายลักษณ์อักษรล่วงหน้า และห้ามใช้อุปกรณ์ โปรแกรมหรือขั้นตอนวิธีรูปแบบใด มาดึงข้อมูลจากหน้าเว็บมาเป็นข้อมูลของตัวเอง (Page-scrape)

องค์กรไหนสนใจก็นำไปเขียนเป็นนโยบายป้องกัน “โดนดูดด้าต้า” ไว้เบื้องต้นก่อน แต่จะได้ผลตามกฎหมายไทยหรือไม่ คงต้องรอมีใครไปฟ้องร้องให้เป็น “คดีตัวอย่าง” !?!

ข้อมูลอ้างอิง
ทีมข่าวรายงานพิเศษ หนังสือพิมพฺคมชัดลึก https://www.komchadluek.net/news/scoop/420693