June 19, 2013

Biostatistics Q&A

By TurtleIzzy

以下都是个人理解。欢迎各位拍砖。

描述

统计学干什么?

研究总体和样本的关系。

研究对象是总体。我们只能通过实验去了解,而实验有误差。统计通过有误差的实验结果去(样本)获得真实的总体情况。

怎么看数据

画图。茎叶图,Histogram都可以。

一眼就知道有没有聚集性,偏不偏,正不正太。

常见的参数描述有什么特点?

表现集中趋势

均值(mean)

优点:利用所有信息。

缺点:受到极端值影响大。

适合:具有中心聚集感觉的数据。

中位数(median)

优点:不受极端值影响

缺点:信息利用少

适合:有极端值的数据

表现离散趋势......

January 24, 2013

ansi, gbk, unicode等各种

先说python的事。

python 2.x处理unicode路径时一定要把所有用到字符串的地方全弄成unicode,否则中途可能会出现非常莫名其妙的错误。

os.listdir()接受unicode作为参数时返回的list会自动将所有串解码成unicode,os.join()接受unicode作为参数时没有问题,但是如果接受的参数里头既有unicode又有utf-8的话就会发生一些非常奇异的问题。

windows的FAT32和NTFS对文件名的存储都是unicode的。所以向os传递字符串时直接使用unicode是最保险的。

这几天为了写一个纠正编码的程序,好好地去把unicode、......

January 15, 2013

stayfocused

最近在各种期末复习,期末复习必不可少的东西是电脑,电脑必不可少的东西是网。为什么呢?遇到不懂的还是要查一下wiki的。

有了网就有了无穷的诱惑。从人人到reddit再到phdcomics,反复骗自己说「再看一页就关上」,但最终都能刷个几十页的。如果只是刷这些东西的话还并不是最严重的,因为脑内的伦理回路会告诉你你在作恶,然后不断用罪恶感折磨你久经摧残的肥厚的心,这样会形成一个负反馈的驱动,最终还是会把你拉回正常轨道。但是如果是在你正经地查wiki的时候,在正当的科学好奇心的驱动下你一级级点开wiki里头的页面,在人类知识的海洋里头忘我地遨游,回过神来的时候——嗯,一个小时过去了。由于开始时的目......