DDR爱好者之家 Design By 杰米
1、读文件
import csv csv_reader = csv.reader(open("data.file", encoding="utf-8")) for row in csv_reader: print(row)
csv_reader把每一行数据转化成了一个list,list中每个元素是一个字符串。
2、写文件
读文件时,我们把csv文件读入列表中,写文件时会把列表中的元素写入到csv文件中。
list = ["1", "2", "3", "4"] out = open(outfile, "w") csv_writer = csv.writer(out) csv_writer.writerow(list)
可能遇到的问题:直接使用这种写法会导致文件每一行后面会多一个空行。
解决办法如下:
out = open(outfile, "w", newline="") csv_writer = csv.writer(out, dialect="excel") csv_writer.writerow(list)
在stackoverflow上找到了比较经典的解释,原来 python3里面对 str和bytes类型做了严格的区分,不像python2里面某些函数里可以混用。所以用python3来写wirterow时,打开文件不要用wb模式,只需要使用w模式,然后带上newline=''。
3、示例
- 简单读写
import csv class writer: def __init__(self): self.dict = { "标题": "标题", "链接": "链接", "服务": "服务", "dsr": "dsr", "店铺名": "店铺名", "价格": "店铺名", "付款人数": "付款人数", "发货地": "发货地", } out = open("outfile.csv", "w", newline="") self.csv_writer = csv.writer(out, dialect="excel") self.csv_writer.writerow(self.dict) def writer_to(self, key_value): self.csv_writer.writerow(key_value) if __name__ == "__main__": a = writer() new = { "链接": "http://www.baidu.com", "标题": "我是标题", } a.dict.update(new) print(a.dict) a.writer_to(a.dict.values())
- 结合爬虫
import csv from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.common.exceptions import TimeoutException, NoSuchElementException from selenium.webdriver.common.action_chains import ActionChains driver = ["1", "2"] colspan = ["1", "2"] try: out = open("类目.csv", "w", newline="") except PermissionError: print("文件被其他程序占用") input("") csv_writer = csv.writer(out, dialect="excel") csv_writer.writerow(["宝贝ID", "类目"]) def open_chrome(): driver[0] = webdriver.Chrome() driver[0].get("https://www.dianchacha.com") input("请登陆后按回车:") def EC_located(one_group, value): """ 目的:简化代码长度,参数1选择one或者group切换选中模式 :param value:要找的值【CSS选择器】 :return:选择到的对象 """ wait = WebDriverWait(driver[0], 10) if one_group == "one": try: ecl = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, value))) return ecl except TimeoutException: print(value, "1元素未加载成功,等待超时") else: try: ecl = wait.until( EC.presence_of_all_elements_located((By.CSS_SELECTOR, value)) ) return ecl except TimeoutException: print(value, "1元素---组---未加载成功,等待超时") def operating(ID): # 先获取ID输入框 driver[0].get("https://www.dianchacha.com/item/info/index/iid/" + ID) html = driver[0].page_source if "未能找到亲的宝贝" not in html: colspans = EC_located("group", ".colspan-1") colspan[0] = str(colspans[1].text).replace("宝贝类目: ", "") else: return operating(ID) print(colspan) def writer_txt(): csv_writer.writerow([url[0], colspan[0]]) print("保存", url[0], colspan[0], "成功") url = ["0", "1"] def main(): open_chrome() file = "宝贝ID.txt" with open(file) as f: for line in f.readlines(): url[0] = line print(line) operating(url[0]) writer_txt() out.close() print("已完成") if __name__ == "__main__": main()
以上就是利用python 读写csv文件的详细内容,更多关于python 读写csv文件的资料请关注其它相关文章!
DDR爱好者之家 Design By 杰米
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
DDR爱好者之家 Design By 杰米
暂无评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
2024年11月16日
2024年11月16日
- 那英《如今》引进版[WAV+CUE][1G]
- 蔡幸娟.1991-真的让我爱你吗【飞碟】【WAV+CUE】
- 群星.2024-好团圆电视剧原声带【TME】【FLAC分轨】
- 陈思安.1990-国语钢琴酒吧5CD【欣代唱片】【WAV+CUE】
- 莫文蔚《莫后年代20周年世纪典藏》3CD[WAV+CUE][2G]
- 张惠妹《我要快乐》华纳[WAV+CUE][1G]
- 罗大佑1982《之乎者也》无法盗版的青春套装版 [WAV+CUE][1G]
- 曾庆瑜1989-款款柔情[日本东芝版][WAV+CUE]
- Scelsi-IntegraledesquatuorsacordesetTrioacordes-QuatuorMolinari(2024)[24bit-WAV]
- 房东的猫2017-房东的猫[科文音像][WAV+CUE]
- 杨乃文.2016-离心力(引进版)【亚神音乐】【WAV+CUE】
- 群星.2024-珠帘玉幕影视原声带【TME】【FLAC分轨】
- 芝麻龙眼.2008-光阴隧道民歌记录3CD【乡城】【WAV+CUE】
- 谭艳《再度重相逢HQII》头版限量[低速原抓WAV+CUE][549M]
- ABC唱片《蔡琴三十周年纪念版》6N纯银镀膜 [WAV+CUE][1.1G]