本文提供了一种格式化文件名的方法。
OsString / &OsStr
是一种字符串类型,可以表示平台本机字符串,与操作系统强关联。
- 在 Unix 系统上,字符串存储为非零8位值序列,是UTF-8编码。
- 在 Windows 上,字符串存储为非零16位值序列,是UTF-16编码。
在上传附件或备份相关的需求时,经常会遇到需要格式化文件名的场景,这里通过采用数组join
的方式处理。示例如下:
动态构造文件名
#[test]
fn test_join() {
let str1 = OsStr::new("1");
let str2 = OsStr::new("你好");
let str3 = OsStr::new("2");
let str4 = OsStr::new(".txt"),
let joind = [str1, str2, str3, str4].join(OsStr::new(""));
assert_eq!(joind, OsStr::new("1你好2.txt"));
}
解析windows文件名
从文件名中解析出部分信息,然后再拼接其它的信息重新构造出一个新的文件名。
#[test]
#[cfg(windows)]
fn test_osstr_encode_wide() {
use std::os::windows::ffi::{OsStrExt, OsStringExt};
// 转换为UTF-16编码的字节数组
let str1 = OsStr::new("1你好2");
let vec_u16: Vec<u16> = str1.encode_wide().collect();
assert_eq!(vec_u16, vec![49, 20320, 22909, 50]);
assert_eq!(vec_u16, "1你好2".encode_utf16().collect::<Vec<u16>>());
// 可以使用 spit_off 按索引分隔
let str = OsStr::new("1你好2");
let mut vec_u16_mut: Vec<u16> = str.encode_wide().collect();
let right_vec_u16_mut = vec_u16_mut.split_off(2);
assert_eq!(vec_u16_mut, "1你".encode_utf16().collect::<Vec<u16>>());
assert_eq!(right_vec_u16_mut, "好2".encode_utf16().collect::<Vec<u16>>());
// 也可以使用 spit_at 按索引分隔
let str = OsStr::new("1你好2");
let vec_u16: Vec<u16> = str.encode_wide().collect();
let (left, right) = vec_u16.split_at(2);
assert_eq!(left, "1你".encode_utf16().collect::<Vec<u16>>().as_slice());
assert_eq!(right, "好2".encode_utf16().collect::<Vec<u16>>().as_slice());
// 可使用 splitn 按数量分隔
let str = OsStr::new("前缀_时间戳_hash_文件名");
let vec_u16: Vec<u16> = str.encode_wide().collect();
let value: Vec<&[u16]> =
vec_u16.splitn(4, |num| *num == '_' as u16).into_iter().collect();
assert_eq!(
value,
vec![
vec![21069, 32512],
vec![26102, 38388, 25139],
vec![104, 97, 115, 104],
vec![25991, 20214, 21517]
]
);
assert_eq!(value[3], vec![25991, 20214, 21517]);
// 取出 hash 部分的值
let hash_os_string = OsString::from_wide(value[2]);
assert_eq!(hash_os_string.into_string().unwrap(), "hash");
}