iTeau

ประวัติเอกสารจากหมวดหมู่ ‘สถิติ : Statistics’

ใครอ่านอะไร อ่านทำไม อ่านแล้วได้อะไร

In library2.0, งานวิจัย : Research, บรรณารักษ์ : Librarian, สถิติ : Statistics, ห้องสมุด : Libraries on มีนาคม 17, 2009 at 10:16 am

ถ้าใครติดตามอ่านงานเก่า ๆ ของผม คงจะพอทราบว่า ผมค่อนข้างจะสนใจเรื่องการความรู้เกี่ยวกับการอ่านมาใช้ให้งานห้องสมุดและเทคโนโลยีที่เกี่ยวข้อง การอ่านเป็นเหมือนพฤติกรรมที่เห็นอยู่ทุกเมื่อเชื่อวันสำหรับคนทำงานห้องสมุด แต่โดยลึก ๆ มันคือ การสัมผัสที่ทำให้เราได้มาซึ่งสารสนเทศที่เราต้องการ

ผมไม่ค่อยเห็นคนไทยบ้านเราทำการวิจัยหรือพัฒนาเกี่ยวกับการอ่านจากมุมมองของบรรณารักษ์เท่าไหร่ ในแบบจำลองด้านการศึกษาผู้ใช้ส่วนใหญ่ส่วนใหญ่มักมองข้ามกระบวนการในการรับรู้ขั้นพื้นฐานนี้ไป ก็เลยเป็นที่มาของบทความชิ้นใหม่บน On Open ซึ่งพยายามทำความเข้าใจกับพฤติกรรมการอ่านหนังสือของคนไทยผ่านผลการสำรวจของสำนักงานสถิติแห่งชาติปีล่าสุด (2551) และการสำรวจครั้งก่อน (2548) หลังจากนั้นก็มาลองหาสาเหตุทางด้านจิตวิทยาว่า ทำไมคนถึงอ่านหนังสือ และปิดท้ายด้วยคำถามที่ว่า จะนำความรู้และแนวความคิดด้านการอ่านมาใช้ในงานห้องสมุดและศูนย์สารสนเทศได้อย่างไร บทความนี้ก็เพียงต้องการจะกระตุ้นให้เกิดการตระหนักถึงต่อยอดความรู้เรื่องการอ่านแล้วนำมาพัฒนาการทำงานต่อไป หวังว่าพออ่านได้ (ถึงแม้ว่าจะยาวไปหน่อย ก็ทะยอยอ่านก็แล้วกัน)

และก็ถือว่าเป็นการต้อนรับสัปดาห์หนังสือแห่งชาติไปในตัว…

Visual Literacy Fail

In บ่นไปเรื่อย : Saying, สถิติ : Statistics on มีนาคม 11, 2009 at 10:17 am

Visual Literacy Fail

ปัญหาไม่ได้อยู่ที่ตัวเนื้อหาเลย หากแต่อยู่ที่ตัวแผนภูมิต่างหาก ไม่ต้องอธิบายมาก คนอ่านแผนภูมิทั่วไปคงจะเข้าใจได้ไม่ยาก ไม่รู้ว่าใช้โปรแกรมอะไรทำ

ที่มา: รายงาน การสำรวจความคิดเห็นของประชาชนที่มีต่อพระราชบัญญัติข้อมูลข่าวสารของราชการ พ.ศ. 2548 สำนักงานสถิติแห่งชาติ

ค้นแบบ facet บน OPAC

In TCDC, Thaibrarian, iTeaudemia, library2.0, งานวิจัย : Research, บรรณารักษ์ : Librarian, สถิติ : Statistics, ห้องสมุด : Libraries on พฤศจิกายน 14, 2007 at 1:56 pm

เมื่ออาทิตย์ก่อน ไปฟัง CRADLE talk (มีเกือบทุกวันศุกร์ เพื่อแลกเปลี่ยนผลงานทางวิชาการ ว่าใครทำอะไร มีอะไรน่าสนใจบ้าง ในกลุ่มคนที่่สนใจ Digital Library) เรื่อง I Still Can’t Find What I Want: An Evaluation Of Next Generation Library Catalogs That Combine Text Search With Faceted Navigation (ชื่อเรื่องยาวมากกกก) โดย Cory Lown นักศึกษาปริญญาโท กับ Brad Hemminger อ. ที่โรงเรียน

หลัก ๆ ของสัมมนา ก็คือ นำเสนอผลการวิจัยเบื้องต้น  ที่วิเคราะห์จาก Transaction Log เพื่อดูพฤติกรรมคนใช้ Library catalog แบบใหม่ของ NC State เน้นไปที่การค้นแบบ facet

เริ่มต้นด้วยการแนะนำตัวอย่าง facet search ตามที่ต่าง ๆ ไม่ว่าจะเป็น site ที่ใช้ Flamenco (engine ที่พัฒนาที่ UC Berkeley) อย่าง Nobel Prize Winners และ Library Catalog ของมหาวิทยาลัยต่าง ๆ ที่นำเอา Facet มาใช้ในการช่วยค้น ไม่ว่าจะเป็นที่ McMaster University, University of Minnesota, Florida Center for Library Automation (FLCA) รวมไปถึง WorldCat ด้วยเช่นกัน

หลังจากนั้นก็เป็นการนำเสนอผลงานวิเคราะห์ข้อมูล จาก server log ที่เก็บตลอดเวลา 4 เดือน (ซึ่งคาบเกี่ยวทั้งช่วงปิด – เปิดเทอม) ซึ่งมีประเด็นที่น่าสนใจดังนี้

  1. Action หลัก ๆ ก็ได้แก่ การค้นด้วย text, การค้นด้วย facet และเปิดไปหน้าต่อไป (กรณีที่มี result จำนวนมาก ซึ่งหลัก ๆ ของการวิเคราะห์ จะเน้นไปที่การเปรียบเทียบการค้นแบบ Text และ Facet
  2. โดยเฉลี่ย จะมี 5 actions ต่อ session หนึ่ง ๆ โดย 1 session จะใช้เวลาประมาณ 7.5 นาที
  3. 97% ของ session ทั้งหมด จะเริ่มการค้นด้วย text ในขณะที่เพียง 34% (ไม่ถึงครึ่ง) เริ่มต้นการค้นด้วย Facet
  4. ใน session หนึ่ง ๆ การค้นด้วย Text จะมีบทบาทมากในช่วงเริ่มต้น และจะลดลงไปจนถึงระดับหนึ่งจนเป็น plateau ในขณะที่การค้นด้วย Facet นั้นอยู่ในระดับคงที่ แต่อัตราการใช้ก็ยังน้อยกว่าจุดต่ำสุดของการค้นด้วย Text อยู่ดี
  5. เรียงลำดับการใช้ Facet ที่ถูกใช้มากที่สุด จากมากไปน้อย: หัวเรื่อง-เนื้อหาสาระ (Topic), หมวดหมู่ LC, รูปแบบ, สถานที่, Genre, ผู้แต่ง, หัวเรื่อง-ภูมิภาค, ภาษา, หัวเรื่อง-ช่วงเวลา และท้ายสุด Availability (ซึ่ง NCSU พยายามจะเน้นว่าเป็น highlight อันหนึ่งเหมือนกัน)
  6. เมื่อพิจารณาความต่อเนื่อง ระหว่าง action ต่อ action จะพบว่า ผู้ใช้จะค้นแบบ Text และตามด้วย Text เยอะที่สุด ตามมาด้วย 1) การเปลี่ยนหน้าไปเรื่อย ๆ (Next page action), 2) การใช้ Facet หลังจากค้นจาก Text และ 3) การใช้ Facet ต่อจากการค้นแบบ Facet อีกครั้งหนึ่ง

สามารถเข้าไปดู link ตัวอย่างของเว็บที่ใช้ในการสัมมนา (รวมถึง Test site ของ NCSU) ได้ที่ http://www.ils.unc.edu/~lown/examples/

บทวิเคราะห์  (โดยส่วนตัว)

ถ้าดูผ่าน ๆ ตัวเลขข้างบนค่อนข้างอันตราย เนื่องจากอาจทำให้ตีความผิดได้ว่า การลงทุนปรับระบบ และนำ facet มาใช้ ไม่ได้รับความนิยม และทำให้คิดต่อได้ว่า ไม่คุ้มค่าต่อการลงทุน

ซึ่งจริง ๆ แล้ว ตัวเลขพวกนี้ ต้องมองอาศัยข้อมูลอื่น ๆ เพื่อช่วยสนับสนุน เช่น ในบรรดาคนที่ใช้ คือ ใคร (ถ้ามีแต่บรรณารักษ์ใช้ ก็ไม่คุ้มแน่ ๆ) ถ้าใช้ แล้วประสบความสำเร็จเพียงใด มีการสอนการใช้อย่างไร มีการประชาสัมพันธ์อย่างไร (แน่นอน คนที่สนใจห้องสมุด รู้จักดี แต่คนภายในนั้นรู้จัก หรือไม่ คือโจทย์ที่สำคัญกว่า เหมือนกับที่ผมเคยพูดถึง case ของ TCDC เมื่อตอนไปพูดเรื่อง Library 2.0)

นอกจากนี้ ยังมีปัจจัยเชิงเทคนิคอื่น ๆ เช่น ความเคยชินของผู้ใช้ เนื่องจาก ระบบห้องสมุด ที่ใช้กันมานานหลายสิบปี ก็เริ่มต้นมาจากการค้นแบบ Text ทั้งนั้น อะไร ๆ ก็พิมพ์เองหมด ประเด็นต่อมา คือ ประเด็นด้าน HCI ที่ปรกติ Catalog จะเริ่มต้นหน้าเว็บด้วย การมีช่องให้พิมพ์ Facet จะเอาไปซ่อนไว้หลัง ๆ อย่างในกรณีของ NCSU เค้าเอา Text search เป็นหน้า default และเอาหน้า Browse ไปไว้ข้างหลัง ทั้ง ๆ ที่จริง ๆ แล้ว งานวิจัยหลายชิ้นก็ชี้ให้เห็นว่า ผู้ใช้ชอบการ Browse หนังสือบนชั้นมากที่สุด การ Browse ตามหมวดหมู่ LC บนเว็บ โดยเทคนิค จึงไม่ต่างอะไรกับการ Browse จากชั้น เพียงแต่การมันไม่ได้เห็นตัวเล่ม ไม่มีโอกาสได้ Preview

อย่างไรก็ตาม ปัญหาของ Facet ก็คือ ความคลุมเครือ เนื่องจากหัวเรื่องเดียวกัน อาจมีได้มากกว่า 1 ความหมายและหลายบริบท โดยเฉพาะอย่างยิ่ง ผู้ใช้ไม่สามารถเข้าถึงหลักในการกำหนดหัวเรื่องได้ เหมือนกับบรรณารักษ์ ดังนั้น ความสับสนในการทำความเข้าใจกับหัวเรื่อง จึงเป็นอุปสรรคอันหนึ่ง ที่อาจจะทำให้ Facet ไม่ได้รับความนิยม

จากที่ว่ามานี้ จึงน่าสนใจหากจะลองมาดูที่ Catalog ของ TCDC ว่ามีความแตกต่างกันอย่างไร เพราะ TCDC ค่อนข้างมีความแตกต่างในด้าน Interface Design จากเว็บห้องสมุดอื่น ๆ และผู้ใช้มีส่วนร่วมในการกำหนดหัวเรื่องด้วยตัวเอง (Folksonomy) ซึ่งจะเปิดโอกาสให้ผู้ใช้ สามารถกำหนดคำสำคัญได้ด้วยตนเอง แต่กระนั้น ก็อาจจะยังมีปัญหาในด้านความเกี่ยวข้องและ Collocation ในเชิงภาพรวม ถ้าสามารถเอา Transaction Log  ของ TCDC มาศึกษาดู ก็น่าจะดี (แต่ว่า ไม่รู้ว่าจะทำได้หรือเปล่า -_-”)

Blog Preservation Survey – Preliminary Results

In JOMC490, blogophere, iTeaudemia, preservation, งานวิจัย : Research, ชุมชน : Community, บรรณารักษ์ : Librarian, สถิติ : Statistics, ห้องสมุด : Libraries on กรกฎาคม 5, 2007 at 1:27 am

Carolyn just got back from presenting our poster at JCDL in Vancouver and set up a blog sharing the preliminary results from the study, “Blogger Perceptions on Digital Preservation” [project website; survey invitation] that some of you participated in our study. You can have a look at them at “persistentblog.wordpress.com“. Note that the preliminary results include only descriptive analysis of the responses.  Anyway, I think they are quite useful and give you the big picture of what is going on.

The handout version of the poster is also available. However, I found if you print it on Letter or A4 paper, it is quite hard to read.

I would like to prompt you about interpreting and distributing these results. Firstly, the majority of our respondents tends to come from professional field, in particular information, library, and communication studies. As you can see in the Subject Areas section, the majority of respondents said they blog about professional interests, followed by technology. Interestingly enough, life and personal experience, usually the most written topic from other studies including a couple of Pew studies, become the third cited subject. In addition, we are also concerned about how highly educated our respondents are. 63% earned graduate and professional degree (beyond undergraduate).

This is mainly because of the limitation of snowball sampling technique, although we tried to get it out to the public as much as possible. Therefore, these results tend to reflect those who are conscious/concerned about preserving their own content. There are a couple of results that we think they are off-the-ground. Also as the number of bloggers keeps growing every minutes, it is hard to generalize the entire bloggers as our populations. In particular, we have only 215 valid responses which is considerably low. Therefore, if you want to make comment on any of these results, please note that these results could hardly imply to bloggers in general.

In addition, some descriptive figures could not be directly interpreted. They need additional contextual information. For instance, we could not summarize the money to invest in preserving blogs without geographical context because the value of blog based on currency could not be directly compared (e.g. $5 in the US is not culturally worth as $5 in Jamaica). We probably need to analyze the money investment by country, for example.

Additionally, we have received a number of valuable comments regarding how we ask and construct the questions which confused them. We do really appreciate all of your comments and we will take them into our consideration for the analysis and future work.

Note that this work is licensed under Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 United States License. Therefore, feel free to share, copy, distribute, display this work not for commercial purposes. Please also link us back to the page, if you want to distribute.

We are still working on writing as journal articles to share our results and what we have learned from this project. When we finish the paper version, I will update to you folks again.

—–

จริง ๆ สำหรับคนไทย ตอนแรกผมคิดว่า ถ้ามีจำนวนคนตอบแบบสอบถามมาก ก็จะแยกออกมาวิเคราะห์ต่างหาก แต่พอเอาเข้าจริง มีคนไทยตอบแบบสอบถามเพียง 8 คน ก็เลยคิดว่า เอาไว้ก่อนดีกว่า ซึ่งผมก็เข้าใจดีว่า ทั้งตัวแบบสอบถามเอง และเทคนิคในการเก็บข้อมูลยังไม่เอื้ออำนวยเท่าไหร่ ทั้งนี้ผมวางแผนไว้ว่าจะทำ version สำหรับคนไทยไว้แล้ว เพียงแต่ว่ามันติดปัญหาเรื่อง IRB ที่ใช้เวลานาน ก็เลยต้องพักไว้ก่อน แต่ถ้าใครสนใจจะช่วยผมทำต่อ เฉพาะในเมืองไทย ก็ลองมาคุยกันได้นะครับ เพราะเครือข่ายของ blogger คนไทยเราน่าจะไม่ใหญ่เท่าคนชาติอื่น แล้วก็น่าจะเก็บได้ไม่ยาก หรือถ้าใครมี idea อะไรจะ share หรือนำเสนอก็ยินดีน้อมรับครับ

ผู้แต่งที่ไม่ได้แต่ง

In งานวิจัย : Research, สถิติ : Statistics, เป็นการเป็นงาน : Seriously on กุมภาพันธ์ 4, 2007 at 2:34 am

ปรกติในโครงการวิจัย ถ้าใครมีส่วนร่วมในการเขียน หรือวิเคราะห์ข้อมูล ก็จะได้ถูกบรรจุอยู่ในกลุ่ม “ผู้แต่ง” แต่ในบางกรณี โดยเฉพาะงานวิจัยทางการแพทย์ คนแต่งจริง กลับปรากฏเป็นเพียงกิตติกรรมประกาศ (Acknowledgement) เพื่อหลบเลี่ยง bias ที่อาจจะดูไม่ดีในสายตาของคนอ่าน

ล่าสุดนักวิจัยกลุ่มหนึ่ง ศึกษา เรื่อง Ghost Authorship in Industry-Initiated Randomised Trials โดยเฉพาะเจาะจงไปที่ industry-initiated trial พบว่า ประมาณ 75% ของเอกสารประเภทนี้ มีผู้แต่งที่ร่วมในงานวิจัย แต่ไม่ปรากฏชื่อจริง และมีแนวโน้มที่จะเพิ่มขึ้นเรื่อย ๆ โดยนักวิจัยทีี่ทำงานแต่ไม่ปรากฏชื่อมากที่สุด เป็นกลุ่มนักสถิติ

โดยปรกติแล้ว เกณฑ์ในการเอาชื่อคนไปใส่ในงานเขียน ก็แตกต่างกันไป แล้วแต่ style ของคนที่เป็น PI อย่างในกรณีนี้ มันเห็นได้ชัดว่า ที่ตัวเลขมันดูสูงมาก น่าจะเป็นเพราะ ธรรมชาติของงานเขียนประเภท trial อยู่แล้ว ผมเองก็ไม่แน่ใจกระบวนการเขียน trial แบบนี้เท่าไหร่ แต่ถ้าเป็นบทความทางการแพทย์แบบอื่น ๆ ตัวเลขมันน่าจะน้อยกว่านี้

แต่ปัญหาที่น่าคิดก็คือ ปัญหาทางจริยธรรมมากกว่า ที่มันไม่รู้ว่าจะแก้ที่ตรงไหน แล้วใช้อะไรเป็นมาตรฐาน

[ที่มา Improbable Research]

1/5 of Aussies are “potentially” cellphone addicts

In งานวิจัย : Research, สถิติ : Statistics, เป็นการเป็นงาน : Seriously on กุมภาพันธ์ 2, 2007 at 7:23 pm

Diana James, Ph.D. student, at Queensland University of Technology presented the preliminary result from her study, focusing on ” whether or not people are consuming mobile technology in a healthy manner.”

“Given that half the people surveyed were 25 or younger and on fairly low incomes, the amount they are spending is quite significant.”

  • 22% of these people considered themselves to be heavy or very heavy users.
  • They made 3.5 voice calls each day but sent 9 text messages on average.
  • They spent 1 hour a day on talk and 35 minutes of texting (Note: I think it’s a big number here at the texting.)
  • Interestingly enough, only 11% of phone time were used in relation to business.

Nothing may not be totally new, but it explains the replication all over the world.

[Source: EurekaAlert]

เอาเวลาไหนไปดู Youtube

In JOMC490, Open Source, iTeaudemia, งานวิจัย : Research, บ่นไปเรื่อย : Saying, มั่วซั่ว : Miscellenous, สถิติ : Statistics, สื่อสารมวลชน : mass media, เป็นการเป็นงาน : Seriously on กุมภาพันธ์ 2, 2007 at 3:03 am

เวลาคนเรายุ่ง ๆ ก็มันจะโดนถามว่า แล้วจะเอาเวลาที่ไหนไปทำ ซึ่งเป็นหนึ่งในวิธีการถามแบบ critical incident technique* และ Harris Interactive Poll ก็เอามาใช้ถาม คอ YouTube เวลา เวลาที่มาใช้กับ YouTubee นั้น ไปเบียดบังกิจกรรมอะไร คำถามแบบนี้ก็พอจะเอามาอธิบาย “อิทธิพล” หรือ “ผลกระทบ” ของ YouTube ได้ส่วนหนึ่ง เพราะเวลาก็ถือเป็น internal market share ที่ทุกคนมีเท่ากัน 24 ชั่วโมง เพียงแต่ว่าใครจะได้เวลาไหนไป

แต่ก่อนจะไปถึงคำถามนั้น 34% ของคนตอบแบบสอบถาม บอกว่า นั่งดู YouTube ไม่เสียเวลาทำอย่างอื่นเลย ในขณะที่ 66% บอกตรงกันข้าม

ทีนี้ในกลุ่มคนที่บอกว่า ไปเบียดบังเวลาทำอย่างอื่น เค้าบอกไปเบียดบังอะไรกันบ้าง ผมขอแบ่งเอง เป็นสี่กลุ่ม…

  • สื่อ
    • 32% บอกใช้เวลาดูทีวีน้อยลง
    • 12% บอกดูดีวีดีน้อยลง
    • 11% บอกอ่านหนังสือพิมพ์ นิตยสารน้อยลง
    • 7% บอกไปดูหนังในโรงน้อยลง
  • Social Capital
    • 12% บอกใช้เวลากับญาติพี่น้อง เพื่อนฝูงน้อยลง
    • 9% บอกคุยโทรศัพท์น้อยลง
  • กิจกรรมออนไลน์อื่น ๆ
    • 36% บอกไปเบียดบังเวลา ในการดูเว็บไซต์อื่น
    • 20% บอกใช้อีเมล์ แชท บล๊อก และกิจกรรมออนไลน์อื่น ๆ น้อยลง
  • อื่น ๆ
    • 19% บอกเบียดบังเวลาทำงาน ทำการบ้าน
    • 15% บอกเล่นวิดีโอเกมส์น้อยลง
    • 1% บอกออกกำลังกายน้อยลง

ตัวเลยที่น่าสนใจคงเป็นสองกลุ่มแรก โดยเฉพาะผลกระทบต่อสื่อเก่าที่ถูกจับตามองอย่างมาก 32% ถือเป็นจำนวนที่ไม่น้อยทีเดียว ที่อาจจะต้องตามต่อ คือ ในบรรดาคนที่บอกว่าเบียดบัง มันเบียดบังไปเยอะมั๊ย เพราะตัวเลข proportion มันอาจทำให้หลอกตาได้ เช่น บอกว่า 12% ของคนดูทีวีน้อยลง แต่น้อยลงคนละแค่ 15 นาที ในขณะที่ คนบอกใช้เวลาอ่านหนังสือพิมพ์ น้อยลงไปเป็นชั่วโมง อันนี้ก็น่าคิด

ส่วน social capital นี้ ถือเป็นคำถาม classic ที่อาจจะดูเก่า เพียงแต่การจับตามองในช่วงเปลี่ยนผ่าน อาจจะทำให้มีหลักฐานมาสนับสนุนว่า การใช้อินเตอร์เน็ท ทำให้ชีวิตสังคม (social life) แย่ลงจริงหรือ

ในผลโพลฉบับเดียวกัน ยังบอกว่า 73% บอกว่า จะใช้ YouTube น้อยลง ถ้ามีโฆษณามาคั่น

[ที่มา Reuters]

*ไม่แน่ใจ ขอเอาออกไปก่อน

Bangkokians with Email and IM

In Social Networking, งานวิจัย : Research, ชุมชน : Community, สถิติ : Statistics, เป็นการเป็นงาน : Seriously on กุมภาพันธ์ 2, 2007 at 2:13 am

Synovate, a marketing research company, reports the result from PAX study, from Q4 2005 to Q3 2006.  The study was initiated by Microsoft Digital Advertising Solutions.  The study covers Asian-Pacific region, but I would like to highlight just the numbers on Thailand.

48% of its respondents in Bangkok used IM, comparing to 65% of the whole region.  55% used email.  However, the figure is still lower than the email usage rate of the whole region, accounted for 63%.

On average, Bangkokian spent more time chatting via IM, 99 minutes per day, than using email, 73 minutes daily.  Interestingly enough, folks in Jakarta spent time on IM the most, 113 minutes daily.

In overall, the report also points out that the majority of its respondents used IM and Email at home and work respectively.

Note that “PAX surveys the top 22% of the adult population aged 25-64″.  I’m not quite sure by “top 22%”.  Also by selecting age 25-64, the study apparently focuses only on working group, which makes more sense for commercial research.  However, the majority of tech users should probably be younger than that.

[See also: MTV shows IM dominating teen life online (Another interesting study done by Microsoft Digital Advertising Solutions)]

Making Sense of Statistics in Court

In INLS715, SOCI708, iTeaudemia, งานวิจัย : Research, สถิติ : Statistics on มกราคม 21, 2007 at 3:26 pm

I talked about making sense of statistical data in general a while back.  Recently, the latest issue of Nature ( vol.  445, no. 7125, p. 254-255 [electronic version requires subscription]) features a story of how statistics has been used and interpreted in court house.  I guess the author, Mark Buchanan, intended to remind to beware of the use of statistics outside scientific arena.  In social setting, nothing can be controlled as in an experiment room.  Context is crucially needed.  He introduced two particular cases.  The first one is suspected nurse who may have killed her patients.  The second one is a mother who has been suspected of killing her two daughters.  Both cases involved the probability of the chances that suspects could have committed murders.

Two points mentioned in the paper are standing out.  For the nurse’s case, the statistician told that “the chance that her presence was mere coincidence was only 1 to 342 million”.  Well that seems very impossible, right?  But the mathematician said by brining additional independent variable – include more factors – the chance could be as small as 1 in 48 or 1 in 5.  My question is which number seems possible for most of us then.  At what level of chance that you can say that could not be coincidence anymore?

Another point is from the quote below.

[L]awyers have an incentive, and even a duty, to select the evidence that makes their case stronger.  “What the judge ends up hearing often comes from the two extreme ends of the distribution,” he (David Kaye) said.

I think the use of statistics is very outstanding example of how people make sense of “number” is very influential and does affect the way we live.

Note:

Inside this issue of Nature (p.249), there is a article about Apple Inc. has been sued by its shareholder about backdating stock options.  They already confessed and Jobs knows about it.

Thai High Schoolers More into Porn Than College Students..

In JOMC490, LAW357C, งานวิจัย : Research, ชุมชน : Community, นโยบาย : Policy, สถิติ : Statistics, สื่อสารมวลชน : mass media, สุขภาพ : Health, เป็นการเป็นงาน : Seriously on มกราคม 15, 2007 at 1:29 am

Dr.Amornwich Nakornthap, director of Ramchitti Institute and PI of Child Watch research project, said that Thai students increasingly consume pornographic media.

The result indicates that 41% of high school students watch porn, while 30% of college kids do. The figures increased from last year about 2% and 3% respectively. The study found the correlation between watching pornography and drinking alcohol and having premature sex.

The data about time used is also noticeable. Thai students spend one-third of their daily lives with technology and media.

Primary-school students and teens are spending up to six or seven hours a day engrossed in their mobile phones, TVs, computers and other electronic gadgets.

The study results also show the average time(s) daily on particular activities:

  • an hour talking on the phone,
  • sending SMS twice,
  • downloading ringtones twice,
  • an hour using the Internet (including e-mail, chat, reading news, and search for information)
  • two hours listening to music,
  • two hours watching movies, and
  • two hours playing computer games

Dr.Amornwich only commented on the pessimistic sides of cyberspace. He said by being on cyberspace for many hours a day, students are risk from Alzheimer’s disease and addiction which could lead to drugs, alcohol, and cyber (and/or mobile) crimes.

[via The Nation, TRF News (in Thai), and Banmuang (in Thai)]

Undergraduates and IT: 2006 ECAR Study

In INLS715, JOMC490, Social Networking, blogophere, งานวิจัย : Research, บรรณารักษ์ : Librarian, มั่วซั่ว : Miscellenous, สถิติ : Statistics, ห้องสมุด : Libraries, เป็นการเป็นงาน : Seriously on มกราคม 13, 2007 at 1:44 pm

The EDUCAUSE Center for Applied Research (ECAR) released a report of a longitudinal study on the undergraduate students and information technology. The report is based on the national survey of undergraduate students. The data collection includes literature review, web-based survey of freshmen and seniors, open-ended questionaire survey, and focus group. The study gives a very nice overview of IT use in academic environment.

Here are some of the key findings from the report.

  • Nearly 98% of undergraduates have PC; about 66.4% own laptop. However, the most owned electronic device is digital camera (72.3%).
  • The use of IT highly depends on academic major and class status.
  • “Convenience” is the primary benefit of technology in classroom.
  • Most students prefer “moderate” amount of technology in classroom.
  • 64.4% point out that technology help them to improve their learning. [Note: self-evaluation, not outcome-based]
  • 40.3% say they are more engaged in courses that use technology.

However, I would like to highlight some other detail findings in the full report that would be helpful.

Time

  • On average, students spend 23 hours a week using technology. (About 3 hours a day)
  • More than 25% of male respondents use technology more than 30 hours a week.
  • Engineering majors spend more time on technology the most (30.3 hours a week). Interestingly enough, Education majors least spend time on technology than others (18.8 hours a week).

Activities

  • Nearly all (99.9%) use email.
  • 81.5% use IM, mostly on daily basis. Younger undergradates and those who live on-campus tend to use more than others.
  • 94% access library website.
  • 70.6% say they use social network sites, preferred by younger students and those who live on-campus. About two-third use them several time a week.
  • 28.6% have weblog, prefered by younger and Fine Art majors. The majority blogs on “monthly” basis. [I wonder how many of them use for course purposes and others.]

Note that the top two factors of using IM and social network sites are the same. On-campus younger students tends to use IM and social network sites.

Another figure that might be interesting for virtual reference folks is the preference on first choice of institutional communication. Only 3% prefer IM to be first choice for institutional communication. About 6% of those who use IM daily prefer IM to be the first choice for institutional communication. However, the term “institutional communication” is quite broad. I wonder if the questionaire is more specific to VR, the figure might be higher. However, if IM is most prefered by younger, the preference of using IM for institutional communication would be increasing.

Skill

I would like to highlight the minimal or no skill group instead of basic and advance users. The study found 9.4% has perceived minimal or no skill of online library resources which the majority could fall into freshmen obviously. However, it seems like academic major is also the important factor. Social science seems to be the most library-oriented major. My further thought go to which major has least skill.

Another interesting figure is 34.3% say they have minimal or no skill course management system. This is a large number. I think this is not just a problem of IT department. Library folks should not oversee this issue as well since the connection between CMS and library collection is very high. I would think that libraries, in addition to IT , might have to take the role of improving CMS skill. Anyway, this figure might come from the fact that not all courses use online. Note that 75% says they have been engaged in using CMS, preferred by senior in 4-year institutions.

Social Software in Courses

  • 30.9% of freshmen and 15.5% of seniors used social network site in courses (12.3% for community college).
  • 11.8% of freshmen and 18.0% of seniors says they use IM in courses.
  • 6.1% of freshme and 7.9% of seniors use blogs in class. [I would assume read and write combined.] Interesting students in community colleges use blogs slightly more than those in 4-year institution (8.2%). Again, Fine arts majors tends to use more than others.
  • Less than 4% use webcast and/or podcast during courses.

In terms of perceived benefits of the technology, students think podcast help them improve learning the most (23%). Significantly enough, CMS is perceivably least improved their learning (12.4%). However, the majority thinks CMS is the most convenient technology (55%). Here are the percieved benefits of other social technology.

IM

  • 45.7% says it is convenient.
  • 21.6% says it improves their learning.
  • 19.2% says it helps manage course activitiy.
  • 11.1% says it helps them communicate.
  • 2.4% says it has no benefits.

Blog

  • 47.8% says it is convenient.
  • 19.1% says it improves their learning.
  • 19.4% says it helps manage course activitiy.
  • 11.2% says it helps them communicate.
  • 2.6% says it has no benefits.

Social networking software

  • 47.9% says it is convenient.
  • 17.9% says it improves their learning.
  • 20.7% says it helps manage course activitiy.
  • 11.1% says it helps them communicate.
  • 2.4% says it has no benefits.

The paper cited one of interesting studies done by Student Monitor (Carney, 2006 cited on p. 24). They cited that iPods was more “in” (73% of respondents) than beer or Facebook (both 71%).

As one may question about self-evaluation aspect of the study, the study team already points out, in executive summary, the ongoing complexity of outcome-based debate. They believe that “students are reasonably reliable evaluators of the educational contribution of IT”.

Blogosphere in Asia

In INLS715, JOMC490, Social Networking, งานวิจัย : Research, สถิติ : Statistics on พฤศจิกายน 29, 2006 at 10:31 pm

Microsoft released a report on Blogging Asia: A Windows Live Report. The study conducted online of more than 25,000 MSN portal visitors, launched August this year, in seven countries including Hong Kong, India, Korea, Malaysia, Singapore, Taiwan, and Thailand.

Here are the key findings that I found interesting:

  • 74% find blogs by friends and family to be most interesting; seconded by work colleagues
  • Young people and women dominate (except India where it is overwhelmingly a male domain and Korea where blogging is a part of everyday life for all)
  • 50% believe blog content to be as trustworthy as traditional media. A quarter of respondents also believed
    blogs to be the quickest way to learn about news and current affairs.
  • 41% spend more than three hours a week blogging
  • More than 40% have less than 10 visitors per week
  • 53% chose to start a blog to share a diary or photo album with loved ones; seconded by work colleagues.
  • Politicians fared poorly across the region with only 14% interested in reading their blogs except in Malaysia where they were quite popular with 20% listing this type of blog as being of interest.
  • India stood out with half of all respondents showing a strong interest in business blogs, ranking them as the most interesting.
  • Their perception toward a good blog is (1) the one that is updated regularly and, (2) the one that is well written with eye catching pictures.
  • For them, the most annoying aspect of blog is they don’t know when the blog is update, boring content, and badly written entries. [Note: Could it assume that many Asian bloggers don't know about web syndication? They might heard but don't know how it works? They may know but don't use it?]

[Via Smart Mobs and PR Newswire]

Social Networking in Dormitory

In INLS715, JOMC490, Social Networking, บ่นไปเรื่อย : Saying, สถิติ : Statistics, เป็นการเป็นงาน : Seriously on พฤศจิกายน 2, 2006 at 3:55 am

I have to admit that at first I did not intend to write this post this long. I actually just wanted to keep reference myself about Vanden Boogart’s thesis with my reflective idea. However, after finding evidences to support my thought, I found a couple of related papers about social networking in dormitory, which I think interesting and might supplement to his framework.

Matthew Vanden Boogart sent out a link to his master thesis at Kansas State University on Facebook and residence hall via air-l listserv. There are a lot of interesting points to discuss about this fine work, entitled “Uncovering the Social Impacts of Facebook on a College Campus“. He investigates social impacts of Facebook on dorm life by using web-based survey asking on-campus students from four universities: Kansas State University, Samford University, University of Florida, and University of Kansas.

About 95% of them are on Facebook. 32% have their own blogs. The demographics shows that women, students of color, students with lower GPAs, first year undergraduates, and those living in co-ed environment tends to engage on Facebook more frequently. About 30% said they “feel” addicted to Facebook. About 17% of sample spend more than 1 hour a day on Facebook. The study reconfirms the notion that students use Facebook for keeping connected to high school friends and checking what friends are doing rather than making new friends (p. 36) (see also Fred’s study). However, non-heterosexual, students of color, and those who have lower GPAs tend to use Facebook to make social connection that could not find in person more than other groups.

Weak ties

“The average respondent had 145 friends at their institution and 127 friends at other institutions. The range of these responses were as low as 0 and as high as 1800 for one individual”. (p. 32)

I still “wow” by the maximum number of 1800 friends which one could figure out easily that those are primarily weak tie. Also it is not that too hard to have “friends” that many, even they are first year undergraduates as Fred already pointed out.

However, one evidence that would be helpful to support, but does not appear, in his study is the combination between online and physical relationship; whether students maintain neighboring friends on Facebook or not. If so, how? What kinds of activity/interaction they do to maintain the relationship with their dorm neighbors on Facebook? These questions could also portray how SNS facilitate physical relationship (e.g. strengthening weaker social ties).

To do so, one of variables that may need to be controlled is the size of residence halls and campus. The assumptions of the greater role of Facebook on on-campus life could possibly favor the larger unit of social connection, whether larger floor, building, or campus, hypothetically due to the large number of weak ties. Well, that may not be the case. Why?

Micro-localization

Read the rest of this entry »

Internet Addiction Disorders

In INLS715, JOMC490, มั่วซั่ว : Miscellenous, สถิติ : Statistics, เป็นการเป็นงาน : Seriously on ตุลาคม 18, 2006 at 6:50 pm

A study done by researchers at Stanford’s Medical School found that “more than one in eight US residents show signs of ‘problematic internet use.’” The data was collected from 2,513 adults around the US by using telephone survey.

5.9% felt their relationships suffered as a result of excessive Internet use;
8.7% attempted to conceal non-essential Internet use;
3.7% felt preoccupied by the Internet when offline;
13.7% found it hard to stay away from the Internet for several days at a time;
8.2% utilized the Internet as a way to escape problems or relieve negative mood;
12.3% had tried to cut back on Internet use, of whom 93.8% were successful; and,
12.4% stayed online longer than intended very often or often.

After calculating conditional probabilities, preoccupation when offline looks scariest because it is highly associated with other matters. Just for fun, I played with those figures (in Table 2 of the paper) by calculating the average (in parentheses) of these conditional probabilities of each behavior (a chance of people who have one behavior to have another one as well) and ordering them. I think the relationship might somehow tell the order of severity of each category, although it is not necessarily the case.

  1. Preoccupied when offline (0.38)
  2. Online longer than intended VERY often (0.35)
  3. Relationship suffer (0.26)
  4. Used to escape (0.24)
  5. Tried to cut back (0.23)
  6. Conceal use (0.22)
  7. Online longer than intended often (0.18)

However, the article in New Scientist point out that the most concern by this research team is hiding internet use which “mirrors the way alcoholics behave”. Then my further question is hiding the use from whom? and when do they usually hide? and why they hide? I think these questions are also interesting to follow up.

“The issue is starting to be recognised as a legitimate object of clinical attention, as well as an economic problem, given that a great deal of non-essential internet use takes place at work,” Aboujaoude says

I think this type of research is very helpful to supplement such a controversial argument whether or not the Internet has effects to individual and social life in terms of clinical and psychological aspects. At the end of the paper, it also points out the important of sociocultural factors.

Sociocultural factors warrant exploration. Social isolation and the desire for connectedness, the thrill and freedom brought on by online anonymity, and the extreme, unregulated, advertising tools used to lure individuals to Internet venues all likely play a role in promoting problematic Internet use and, as such, deserve attention. (Aboujaoude, 2006)

Also the reference of the paper looks like a very interesting list to follow.

[via New Scientist]

Sense Making of Statistical Information

In INLS715, SOCI708, บ่นไปเรื่อย : Saying, สถิติ : Statistics on สิงหาคม 30, 2006 at 10:46 pm

It is interesting to see how statisticians and researchers make sense of the data they collected and analyzed. From today’s statistics class, I made two major points in my notebook.

Firstly, a part of the discussion is about whether Likert scale should be treated as ordinal or interval/ratio scale. Likert scale is intended to measure people attitude ranging from negative to positive attitudes. The degree of agreement is given numeric value for scale. It can be 5, 7, or 10 point scale. Most of the papers I have gone through so far treat those scale as interval/ratio. The obvious practice is they seek the central tendency by mean (average). Then some of them imply the numeric value back to the meaning. For instance, in 5 point likert scale (from 1-most unsatisfied to 5-most satisfied), the average of the response is 2.5326. I am not sure you can imply that it should fall in to just “satisfied” or “neutral”.

For me, it is hard to say because the distance between degrees is hard to be justified and given the meaning, although there is a choice to add granularity of the scale to 10. I still think there is limitation in that scale.

Also, I think it might be interesting to see the reliability testing of the scale. Although the explanation is given to each degree in the instrument, it is hard to say that my “4 rate” is equal to other people’s “4 rate”. Anyway, the scale range might help a lot in this case.

Another interesting point to me, as it is still the unanswered question to me, is about how people make sense of decimal digits. How people decide how many digits they want? When they will and will not use it, whether intentionally or unintentionally? What criterias (variables) involved to define the context of use? For example, you go to the supermarket and you found the number “$54.99″ on the price tag. The decimal digits would help you to think that it is nearly $55. However, it might be worthless to specify the decimal place when someone asked you the price of the product you bought for a fun talk. I wonder too that, in relation to the fractions of the amount of money, people who strick their financial activities would be more serious with decimal than others. Anyway, that is just my assumption. We might be able to use basic communication model to capture the elements roughly which may include background, time, location and such.

Orditerval/Ordiratio Variables in IR Research

In SOCI708, iTeaudemia, บ่นไปเรื่อย : Saying, สถิติ : Statistics on สิงหาคม 28, 2006 at 9:13 am

I know it’s kind of freaky name. In the second class of the first week, we talked about three types of variable: nominal, ordinal, and interval/ratio. Some variables are flexible, can fall into any category depending on context. Also one category will help the others to define each other. Especially ordinal variable, we basically cannot measure the distance between categories. However, a lot of people appreciate the exact number shown in the result as it makes the report look more scientifically. Therefore, they often threat ordinal variables as interval/ratio variables.

For example, in relevance judgment area, most studies are intended to find out how people make judgment by let subjects define the level of relevance of document retrieved. One technique I found interesting is continuum. The scale of the continuum is ranged from X- not relevant at all to Y-absolutely relevant. Then researchers observe the degree of relevance by measuring the distance of the continuum and reported as interval/ratio numbers.

In another context, there was a similar study observing the relevance degree by letting the subjects squeezing the measure object as how relevant is the document retrieved. Yes! The focus will be spotted on the reliability of this method. Anyway, as the result of the study, they present the result as the interval/ratio number which may be the “average” degree of relevance. Doesn’t it sound weird for you?

Quantitively Thinking

In SOCI708, iTeaudemia, บ่นไปเรื่อย : Saying, สถิติ : Statistics, เป็นการเป็นงาน : Seriously on สิงหาคม 25, 2006 at 9:22 am

This is the first post in my new blogging series on “iTeaudemia“. Since every single class I’m taking this semester requires reflective journals, I would use this space to blog about my thought, difficulties, anxiety, and such regarding to the classes. A number of people might wonder why I release this stuff publicly, instead of keep it privately for my own sake. I know that people hate to show their weaknesses like stupidity, ignorance, and such on public space (e.g. personal blogs). 

However, I take it as a part of my learning. No one is perfect, as everyone knows. It is not just my future historical records. I hope it would help someone, at least one, to learn from my understanding and failures during my study.

My first class for Fall 06 began on two days ago with SOCI 708 Statistics for Sociologists taught by Cathy Zimmer. I am required to take two consecutive statistics classes during my coursework period. Since there is no statistics class available within my school, I decided to go with the one in Sociology department. I am taking this one because the application of statistics would be beneficial to my future research plan.

Social Statistics for a Diverse Society (Undergraduate Research Methods and Statistics)Two texts are required for this particular class. There are:

Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Social Statistics for a Diverse Society. 4th ed. Thousand Oak: Pine Forge.

and

Allision, P. D. (1999). Multiple Regression: A Primer. Thousand Oaks: Pine Forge.

I didn’t realize that both of them are published by the same publisher. Anyway, most of the class will use the first one.

After reading two chapters of the first book (later called FN+LG), I found this book is very interesting. I know it is intended to use for undergraduate class. As a person to trying to recover their statistics knowledge, I think this book very well covers the introductory and things to remember.  Also I think it would be beneficial to those who are totally new to statistics (of course! that’s what the author intended to).

My first concern about learning statistics is to catch up the content of the class.  If I somewhere lost on the way, it is quite tough  for me to keep following.  I need to get back to make sure I understand particular stuff.  Therefore, one of the features I like the most about this book is the little excerpt summarizing content each section.  It helps me a lot to remind me when I get lost (which happened to me quite often).  And definitely it save my time because I do not need to read the whole long paragraph which is full of example.

Bookmarking and Evaluation of Library Services

In Thaibrarian, บรรณารักษ์ : Librarian, บ่นไปเรื่อย : Saying, สถิติ : Statistics, ห้องสมุด : Libraries, เป็นการเป็นงาน : Seriously on กรกฎาคม 11, 2006 at 5:11 am

Yesterday post made me think further about how this could benefit in terms of evaluating library services.

Library professionals have been discussing about what is the actual “use”, in particular books on shelves.  There are a number of people trying to define the activities that could be taken in to account.  Many libraries use in-house check-in built in ILS as  the measure.  When users return books in the book bins that mean they used it.  However, the in-house statistics do not always represent the actual use.  Some users just grab a book from the shelf to check for relevancy rather than intend to use it.  Then they put it in the book bin as those who actually use it.

Physical bookmarking system can provide the deeper picture of how books are actually be used.  Once users mark bookmark, we could be quite certain that they use it, whether reading, browsing, and such.

However, a book that is not bookmarked does not mean it has not been used.  Users may finish using it without leaving any notice (including bookmarking).  Also they may not need to bookmark because they do not need to use it in the future.  It might be worthwhile to review the psychological aspects of bookmark.