2009-11-29

昏黄的颜色

颜色能引起回忆, 比我清晰记得的更多. 那一瞬, 仿佛又回到那时, 那时, 你会与我挣抢昏黄煤油灯的光.

2009-11-20

C 的一种易调试的宏用法, 以做代码模板

1 C 的一种易调试的宏用法, 以做代码模板

用 C 比较多时, utils 库其实是不缺的, 但要熟悉起来, 编码才会高效. 前一阵子尝试写哈稀表, 承蒙标准云张教主找来一个哈稀表的评测, 里面有些简易实现 -— 是的, 我只看简单的东西. 看完之后, 我站在别人的脚趾头上再实现了几个.

哈稀表实现有开放寻址和链表, 链表实现容易, 但时间和空间开销都较开放寻址 浪费. 做成高效通用的哈稀表, 有时, 多余函数调用的开销也是关键的, 宏和 inline 函数便在此处出现.

inline 函数很好, 不好的地方是类型检查上不绕开不方便, 绕开不安全. 但, 要 函数指针的形式, 便 inline 不得了. 最后一个考虑是宏了.

``该死的宏.''

宏不方便调试. 在写的时候要将几百行串成一行, 编译运行, 可能只告诉你宏调 用那一行有错, 这时要去那几百行慢慢找.

为此, 我看过 CPP 的文档, 失望而归. 然后, 在考虑写软件包自动编译安装脚本时, 发现 M4.

在 M4 之前, 我是想用 sed 来做这事的, 最后还是决定尝试一下不熟悉的 M4.

首先, 如常写 C 头文件代码(设为文件 ht.h.m4), 只是按一种约定, 一种类型的 操作给个共同的函数, 类型名前缀(这不算太坏的编码的规范, 如果不算好), 需 要做为泛型参数的给个名字. 最终, 我期望用 M4 处理一下这文件, 得到, 比如, 哈稀表的宏实现

HT_INIT(name, key_t, val_t, key_hash, key_equal).

其中, name 为结构名, 所有生成的函数结构将都以 name_ 开头. 如 key_hash 原型为

integer key_hash(key_t key)

具体可以是宏, 也可以是函数.

在测试时, 我只要定义好 key_t, val_t, key_hash, key_equal, 再包含头文件 (假设为 ht.h.m4), 就可以测试调用函数, 如

val_t name_get(name_t *p, key_t k).

测试完后, 可以用 m4 -P ht.h.m4 > ht.h 来生成头文件 ht.h, 里面有期望的 HT_INIT 宏. 在用 make 时, 可以添加规则.

%.h: %.h.m4
m4 -I$(srcdir) -P $^ > $(notdir $@)

%.c: %.c.m4
m4 -I$(srcdir) -P $^ > $(notdir $@)

挂羊头, 卖狗肉, 下面给另一个例子.

2 实例

CSEQ, 一个 C 的 sequnce 的实现.

2.1 文件 cpptemps.m4

文件内容如下段, 抽出来, 可以复用.

m4_divert(-1)
m4_define(`CS_QUOTE', `m4_ifelse(`$#', `0', `', ``$*'')')
m4_define(`CS_FOREACH', `m4_pushdef(`$1')_CS_FOREACH($@)m4_popdef(`$1')')
m4_define(`_CS_ARG1', `$1')
m4_define(`_CS_FOREACH', `m4_ifelse(`$2', `()', `',
`m4_define(`$1', _CS_ARG1$2)$3`'$0(`$1',(m4_shift$2), `$3')')')
m4_define(`CS_NO_ARGS',`_CS_NO_ARGS(`$1',`$2', `$'`#', `$'`@')')
m4_define(`_CS_NO_ARGS',`m4_pushdef(`$1',`$2`'m4_ifelse($3,0,,`('`$4'`)')')')
m4_define(`CS_APPEND_BACK_SLASH',`m4_patsubst(`$*',`
.',`\\\&')')
m4_define(`CS_LSTRIP',`m4_patsubst(`$*',`^[
]*')')
m4_define(`CS_DELETE_COMMENT_LINES',`m4_patsubst(`$*',`//[^
]*')')
m4_define(`CS_CASCAT',`CS_APPEND_BACK_SLASH(CS_LSTRIP(CS_DELETE_COMMENT_LINES($@)))')
m4_divert`'m4_dnl

2.2 文件 cseq.h.m4

实现文件, 主题无关的不优雅代码, 所以不全. 其中 defs.h 文件是一些包装内存分配等常见宏的定义.

CSEQ_FUNCS 里都是函数名, 如 size 对应 name_size, 在 CSEQ_INIT(cvs, char) 后, 将生成 cvs_size 函数.

///redundant comment introduced by m4`'m4_ifdef(`CS_FILE_CSEQ_H_M4',`',`m4_define(`CS_FILE_CSEQ_H_M4',`1')
#ifndef FILE_CSEQ_H__
#define FILE_CSEQ_H__ 1

#include "defs.h"
#include <stdio.h>
#include <stdint.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>

__attribute__((__const__))
static inline size_t cseq_cal_resize(size_t n) {
if (n > 134217728UL) {
return n + (n >> 1);
}
return n + n;
}

///m4_ifelse(
/*)
m4_include(cpptemps.m4)
m4_define(`CSEQ_INIT', `m4_ifelse(
CS_NO_ARGS(`name_t', ``$1''`_t')
CS_NO_ARGS(`val_t', ``$2'')
m4_ifelse(m4_eval($# < 3),1,
`CS_NO_ARGS(`CSEQ_FUNC_ATTR', `static inline')',
`CS_NO_ARGS(`CSEQ_FUNC_ATTR', `$3')'
)
m4_pushdef(`CSEQ_FUNCS', (append, array, check_capacity,
free, get, init, new, prepend, realloc, release,
reverse, rmhead, rmtail, set, size, resize, splice, move__,
add, copy, detach, attach))
CS_FOREACH(`x', CSEQ_FUNCS, `CS_NO_ARGS(`name_'x, ``$1_''``''x)')
)m4_dnl*/

typedef struct {
val_t *base;
size_t capacity;
size_t size;
int start;
} name_t;

CSEQ_FUNC_ATTR void name_init(name_t *p) {
memset(p, 0, sizeof(*p));
}

CSEQ_FUNC_ATTR void name_release(name_t *p) {
xfree(p->base);
memset(p, 0, sizeof(*p));
}

CSEQ_FUNC_ATTR name_t* name_new() {
name_t *p = xmalloc(sizeof(name_t));
name_init(p);
return p;
}

CSEQ_FUNC_ATTR void name_free(name_t *p) {
name_release(p);
xfree(p);
}

CSEQ_FUNC_ATTR size_t name_size(name_t *p) {
return p->size;
}

// more bulk such as splice ...

///m4_ifelse(
///m4_popdef(`name_t')
///m4_popdef(`val_t')
///CS_FOREACH(`x', CSEQ_FUNCS, `m4_popdef(`name_'x)')
///m4_popdef(`CSEQ_FUNCS')
///m4_popdef(`CSEQ_FUNC_ATTR')
///)')

#define CSEQ_INIT(name, cval_t) \
CS_CASCAT(CSEQ_INIT(`name``##''',`cval_t'))

2009-08-25

滑稽之难


晚起, 走在路上想起昨天晚上看见别人推荐说鲁迅故居开拆的网址, 当时连
点过去看的兴致都没有. 当今文化继承上先天不足, 区区一被抬政治
身价的文人故居, 便我自居念旧者也不当回事.

鲁迅故居被拆自是不对, 且不说这个, 我所想的却是鲁迅在前朝与今地位的差异.
大抵历代都有褒贬与前相异的事情. 除开小时间段上的政治因素, 也有一部分移
风移俗的原因在里面. 如盗跖寿终, 人们骂天不公已有千年, 今天却觉自然. 再
如李自成起义, 便我不学无术辈, 也曾略听说过有几篇小说, 说得李自成十分不
堪.  最近如洪秀全, 祠堂里尚有记忆, 乡老口中长毛一词, 态度尽与受过民国以
降教育的不同.

昔时年少, 观古人颇有不通处, 尤其所喜人物, 念念间以此求全. 后来, 自己稍
通, 便开解了些. 后之视今, 便如今之视昔, 不知可有赞扬今天不耻的事情, 或
者有以今天光荣为耻的? 苟同于今天的荣耻, 大抵或也会被后辈小子冠以不通? 如早
期, 伤风败俗是近乎致命的罪项了. 而今, 风俗之力渐弱, 但能视风俗篾如却仍
无几. 大抵超脱点, 便是远远避开.

由此, 便想到滑稽. 滑稽难于雍穆.

2009-06-15

六年,七年

上周即议于此周日晚一聚.

下午林海峰答辩, 和尹超一起去围观. 时间比预想的慢了一个小时, 林海峰留下, 我和尹超回来看会电影, 牛钧便开始喊大家出发. 十几个人聚在门前闲聊带等的过了半个小时, 一起四五一组坐车去嘉陵江畔.

席间交错, 有些兴头, 酒便多起来, 头有些晕乎. 想起明天是工作日, 便和另几个同学先坐车回来了.

最后与一个寝室的牛钧, 林海峰碰杯, 牛钧哭道: ``老蒋, 六年了.''

认识牛钧兄七年, 自一起做本科生科研后, 走得近些, 算来也是六年.

牛钧兄达人, 识人多, 常有我辈意外之举, 诗人, 战士几成2002级数院本科生周知的典故.

本科生科研时, 牛钧和我常聚与图书馆自习, 所聊者为数学时甚少, 效率不是一般的低. 我不务正业的看 Knuth 的 The TeXBook, 即而对计算机引起兴趣. 牛兄也有自己的事情, 只偶尔看看, 一起讨论. 有时因为赶时间, 晚上常一起去南门的城隍庙, 也常是坐下来, 闲聊一会, 吃点东西, 又走了.

牛兄随身带着一个精致笔记本, 记些事情. 我翻过几页, 但有几页是牛兄不让看的.

进入研究生后, 与牛兄一个寝室. 牛兄两次出行, 得美人, 闪婚后生下一女, 两个月时眉目间即与牛兄极其相类, 观看的没有不大笑的. 前一阵子阿雅来校, 牛兄以其惊人的能量与其相抱.

我们常坐的新书阅览室前那张桌子, 桌子上提醒牌子后面各自写下有一段话, 引起好几篇留言, 保留约有几年, 现在不在了.

美丽有两种, 一是深刻又动人的方程, 一是你泛着倦意淡淡的笑容.

看一看冷月的桥影, 数一数螺细的花纹, 我倚暖了石栏的青笞, 青笞凉透了我的心坎.

匆匆一别, 默愿牛兄美国求学顺利, 新加坡孩子健康.

2009-05-03

Gmail 联系人信息与 vCard 格式转换的 Python 脚本

地址簿格式, 个人偏好 vCard 格式. 这个格式比较软件中立, 方便在各种格式间转换, 且被大都软件接受为导入或导出格式之一. 大部分手机也支持此种格式交换联系人信息.

如是, 在本地建立一个版本控制的目录, 全是 vCard 文件, 可以方便地做些简单查找, 合并及批量修改.

整理通讯信息, 自然少不了导入导出. 这个 Online vCard Converter 在转换 Gmail 等的联系人信息时十分方便. 我开始便是用这个转换. 但后来数据多了, 教育网又要找代理, 便自己写了几个脚本. 放此备份, 或有同样需求的.

以下为从 Gmail-CSV 到 vCard 转换的脚本.

#!/usr/bin/env python
# -*- coding: utf-8 -*-
 
import csv
import sys
import re

def load_csv(fn):
    f = open(fn,'rb')
    csvs = csv.reader(f)
    head = csvs.next()
    rows = [row for row in csvs]
    for row in rows:
        print to_vcard(head, row)

def get_n_from_fn(fn):
    fn=fn.decode('utf8')
    if ' ' in fn:
        (given, family) = fn.rsplit(' ', 1)
    if re.match('[a-zA-Z0-9_]', fn[0]):
        (given, family) = (fn, '')
    else:
        (family, given) = (fn[0], fn[1:])
    return ('%s;%s;;;' % (family, given)).encode('utf8')

def tel_types_str(*types):
    itypes=[]
    for type in types:
        type=type.upper()
        if type == 'MOBILE':
            itypes.append('CELL')
            continue
        if type in ['OTHER', 'PHONE'] :
            continue
        itypes.append(type)
    ts = ','.join(itypes)
    if ts: return ';TYPE=%s' % ts
    return ''

def to_vcard(head, row):
    ln = '\n'
    vc = []
    vc.append('BEGIN:VCARD')
    vc.append('Version:3.0')
    vc.append('FN:%s' % row[0])
    vc.append('N:%s' % get_n_from_fn(row[0]))
    vc.append('EMAIL:%s' % row[1])
    vc.append('NOTES:%s' % row[2].replace('\n', '\\n'))
    idx = 2
    desc = ''
    for field in head[3:]:
        idx += 1
        type = field.split(' - ')[1]
        if idx >= len(row):
            break
        if type == 'Description':
            desc = row[idx].upper()
            continue
        if not row[idx]:
            continue
        if type == 'Email':
            emails = row[idx].split(';')
            for email in emails:
                vc.append('EMAIL;TYPE=%s:%s' % (desc, email.strip()))
            continue
        if type == 'IM':
            ims = row[idx].split(';')
            for im in ims:
                if ':' in im:
                    (imt, ima) = im.split(':', 1)
                else:
                    if '@gmail.com' in im:
                        (imt, ima) = ('X-GTALK', im)
                    elif '@hotmail.com' in im:
                        (imt, ima) = ('X-MSN', im)
                    else:
                        (imt, ima) = ('OTHER', im)
                vc.append('EMAIL;TYPE=%s:%s' % (imt.upper(), ima.strip()))
            continue
        if type in ['Mobile', 'Pager', 'Fax', 'Phone']:
            tels = row[idx].split(';')
            for tel in  tels:
                vc.append('TEL%s:%s' % (tel_types_str(desc, type), tel.strip()))
            continue
        if type == 'Title':
            vc.append('TITLE;TYPE=%s:%s' % (desc, row[idx]))
            continue
        if type == 'Other':
            continue
        if type == 'Company':
            vc.append('ORG;TYPE=%s:%s' % (desc, row[idx]))
            continue
        if type == 'Address':
            vc.append('ADDR;TYPE=%s:%s' % (desc, row[idx].replace(';', '\\;')))
            continue
    vc.append('END:VCARD')
    nvc = []
    for line in vc:
        if re.match('^[^:]*:[ \t]*$', line):
            pass
        else:
            nvc.append(line)
    return ln.join(nvc) + ln

load_csv(sys.argv[1])
以下为从 vCard 到 Gmail CSV 转换的脚本.

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import csv
import sys
import re
import vobject

def filter_lines(ls, names, types):
    if not isinstance(names, list): names = [names]
    if not isinstance(types, list): types = [types]
    if names:
        ls = [l for l in ls if l.name in names]
    for type in types:
        if type.istitle():
            type = type.upper()
            ls = [l for l in ls if not type in l.params.get('TYPE', [])]
        else:
            ls = [l for l in ls if type in l.params.get('TYPE', [])]
    return ls

def lines_value(ls):
    return [l.value for l in ls]

def filter_lines_value(ls, names, types):
    ls = filter_lines(ls, names, types)
    return lines_value(ls)

def vcard_to_csv(fp, cw):
    for vcf in vobject.readComponents(fp):
        vcf_to_csv(vcf, cw)

def vcf_to_csv(vcf, cw):
    email = vcf.getChildValue('email') or ''
    fn = vcf.getChildValue('fn') or ''
    note = vcf.getChildValue('note') or ''
    fields = [fn, email, note]
    sections = ['WORK', 'HOME', 'OTHER', 'PERSONAL']
    f_sections=[['WORK'], ['HOME'], ['OTHER'], ['Work', 'Home', 'Other']]
    lines = [l for l in vcf.lines()]
    for idx in range(len(sections)):
        section = sections[idx]
        f_section = f_sections[idx]
        s_email=[v for v in filter_lines_value(lines, 'EMAIL', f_section) if v != email]
        s_im = [l.name.replace('X-', '')+': ' + l.value
                for l in filter_lines(lines, ['X-GTALK', 'X-MSN', 'X-ICQ', 'X-JABBER', 'X-AIM'], f_section)]
        s_mobile = filter_lines_value(lines, 'TEL', f_section + ['CELL'])
        s_pager = filter_lines_value(lines, 'TEL', f_section + ['PAGER'])
        s_fax = filter_lines_value(lines, 'TEL', f_section + ['FAX'])
        s_phone = filter_lines_value(lines, 'TEL', f_section +['Cell', 'Pager', 'Fax'])
        s_label = filter_lines_value(lines, 'LABEL', f_section)
        if section == 'WORK':
            s_org = ' '.join(vcf.getChildValue('org') or [])
            s_title = vcf.getChildValue('title') or ''
        else:
            s_org = ''
            s_title = ''
        if s_email or s_im or s_phone or s_mobile or s_pager or s_fax or s_org or s_title or s_label:
            pass
        else:
            continue
        fields.append(section.title())
        fields.append(' ::: '.join(s_email))
        fields.append(' ::: '.join(s_im))
        fields.append(' ::: '.join(s_phone))
        fields.append(' ::: '.join(s_mobile))
        fields.append(' ::: '.join(s_pager))
        fields.append(' ::: '.join(s_fax))
        fields.append(s_org)# company
        fields.append(s_title)# title
        fields.append('')# other
        fields.append('\n'.join(s_label))
    cw.writerow([field.encode('utf8') for field in fields])

if __name__== '__main__':
    csv_prev_headers = ['Name', 'E-mail', 'Notes']
    csv_per_headers = ['Description', 'Email', 'IM', 'Phone', 'Mobile', 'Pager', 'Fax',
                       'Company','Title', 'Other', 'Address']
    csv_headers = csv_prev_headers
    for i in [1,2,3,4]:
        csv_headers.extend(['Section %s - %s' % (i, h) for h in csv_per_headers])
    cw = csv.writer(sys.stdout)
    cw.writerow(csv_headers)
    if len(sys.argv) < 2:
        vcard_to_csv(sys.stdin, cw)
    else:
        for f in sys.argv[1:]:
            vcard_to_csv(open(f, 'rb'), cw)
以下为将 vCard 中的生日信息转换为 iCalendar 文件的脚本.

#!/usr/bin/env python
# coding: utf-8

import csv
import sys
import re
import vobject
import datetime
import dateutil

tzlocal = dateutil.tz.tzlocal()

def vcard_bday_to_ical(fp, ic):
    for vcf in vobject.readComponents(fp):
        bday = vcf.getChildValue('bday')
        if not bday: continue
        bday = bday.replace('-', '').replace(' ', '')
        if len(bday) == '4':
            bday = '1980'+bday
        if len(bday) != 8:
            continue
        print >>sys.stderr, 'parsing ', vcf.fn.value, vcf.bday.value
        date = datetime.date(int(bday[0:4]), int(bday[4:6]), int(bday[6:8]))
        v = ic.add('vevent')
        v.add('dtstart').value=date
        v.add('dtend').value=date+datetime.timedelta(1)
        rrule = dateutil.rrule.rruleset()
        rrule.rrule(dateutil.rrule.rrule(dateutil.rrule.YEARLY, dtstart=datetime.datetime(2009,12,12,tzinfo=tzlocal)))
        v.rruleset=rrule
        v.add('uid').value=vcf.uid.value + '-jiangzuoyan@gmail.com'
        v.add('summary').value=' '.join(
            [i for i in
             [vcf.fn.value,
              vcf.getChildValue('email') or '',
              vcf.getChildValue('tel') or '',
              vcf.getChildValue('bday') or ''
              ]
             if i])


if __name__ == '__main__':
    ic = vobject.iCalendar()
    for file in sys.argv[1:]:
        if file == '-':
            fp = sys.stdin
        else:
            fp = open(file, 'rb')
        vcard_bday_to_ical(fp, ic)
    print ic.serialize()

2009-02-15

归校

寒假在家, 诸事皆废, 唯有读史一项差近. 另, 测得母鸡体温41.2摄氏度.

归校途中至友人家小扰.

收拾东西, 收拾自己, 以前的事, 明天的事, 明天再说吧.

2009-01-01

一个标记

你不应该浪费你宝贵的时间来看, 我也不应该写.

这篇是倒着写, 正着的读.

认真去想, 心情很不稳定. 事情也一样. 相信过几个月再来看这个标记感受肯定不一样.

每年开始时, 都会想些东西, 然后在一年中慢慢忘掉.  今年, 我决定将它记下来.

我不知道是有信仰简单, 还是没有信仰简单.

多年来情况没怎么变化, 我也没怎么长大. 小变化的是我不怎么思考. 多年来, 我慢慢接受了一个事实, 人, 是物质上的人. 有人将这看作可耻的事. 我慢慢接受了这种可耻.

年少时, 我比较轻狂, 以为人可以是精神上的人. 我不是一个机械决定论者, 更不是唯心论者, 也不信被迫学了很多年的死了很多年的马克思. 我什么都不是, 我也不需要谁给我一个信仰. 虽然那时的我还偶尔思考活着.

在北大待了这么多年, 变的可能是对事物比较宽容, 但不代表不极端. 我喜欢极端,  因为它简单.

看看天上的月亮, 想起不久前, 父母的生日还是它提醒我的. 月亮不知道我们的新年.

蒋作延
2009-01-01